うずまき2017 powered by Jun-Systems

耳管開放症, SAS, 統計解析, 人工知能, プログラミングそれに思考

*

2014年IT関連まとめ

   

本当はNAVERとかに真面目にまとめたらそれなりに収入が期待できそうなネタですが、まとめ、キュレーション系のウェブサービスが全般的に嫌いなのでブログにて。思い出したら随時追記するスタイルでやっているので、まだちょっと貧弱です。
 

2014年のIT関連で印象的だったこと

1 IBMのWatson Analytics リリース
2 データ分析関連の煽り本が馬鹿みたいに出た
3 量子コンピュータ的なものが開発された
4 情報管理の話がやたら騒がれた
5 SAS University Editionのリリース
6 ニューロエボリューション
7 トランセンデンス
 

1 IBMのWatson Analyticsリリース

個人的には一番のビッグニュースでした。IBMの豊洲研究所でコンセプトを伺って以来、念願のローンチとなりました。IBM Watson Analytics
手持ちのデータをアップロードしてWatsonに食わせるだけで、データのビジュアライゼーション(可視化: サマリーとして見やすくまとめる)や数値同士の関係の図示、そして推定などをやってくれます。
β版でフル機能が使えたんですが、いつの間にやら正式リリースで機能制限付きの無料版に移行してしまったのでしばらくそれを使っていますが、レベルでいえば大学院の修士レベルぐらいの人間が簡単な相関やら重回帰分析やら走らせた程度のレベルはフリー版で既に持っていると感じました。
あれを見たあとのぼくらは「我々の職は後何年で喰われるか」でもちきりでしたが、今の所はまだ負けない自信があります。
 

2 データ分析関連の煽り本が馬鹿みたいに出た

とにかくめちゃくちゃ出ましたね。データサイエンティスト(笑)みたいなのが。
ビッグデータビジネスはデータ分析自体のビジネスもそうなんですが、むしろこっち方面が強い気がします。ビッグデータ分析に対しては興味はあるものの、プログラミングも統計も分析もそんなに特に使ったことないような人たちに対して、簡単な統計レクチャーに加えてRでの実習ができるような内容の本ですね。
 
そしてデータ分析系のラノベなんて出てきて「とうとうデータサイエンスもここまで来たかあ」と思いました。
 
ぶっちゃけ、データの簡単なサマリー、図解、関係、簡単な回帰、ぐらいの仕事がデータサイエンティストと呼ばれているんだとしたら、そんなレベルでは食べていけないだろうなと真剣に思います。もちろんデータ分析は先に明らかにしたい目的があって、その上で必要な分析プロセスを策定するものです。それにしても、手持ちの武器がこれだけじゃあなあという感じはします。


 

3 量子コンピュータ的なものが開発された

D-Wave、量子コンピュータなのかどうなのか結構微妙な感じのやつですが、少なくとも特定分野においてはそれなりに早い計算が実現できたという報告もあるようですね。冷却が大変なこともあって一般化されるのは程遠いとしても、計算速度が早いことと、その計算の信頼性が証明されれば、専門機関では順次広まっていきそうな感じはしますね。
WIREDの記事NASA、Googleが注目する「D-Wave」は、本当に量子コンピューターなのか? « WIRED.jpが面白かったです。
 

4 情報管理の話がやたら騒がれた

Suicaに続いてTポイントカードやYahoo!あたりの顧客情報の譲渡の話がいろいろと出ましたね。まあ企業側として分析をやりまくりたい気持ちはわかります。ただまあ「オプトイン・オプトアウト」なんていう言葉もありますし、自分のデータが分析されることに対する嫌悪感を持つ人もいるんでしょうね。そこはしっかり意思表示をしてもらい、そしてそれに従う必要があります。ウェブサービスでも、最近はtwitterとかFacebookのアカウント連携でオーソライズする時に、どの情報を渡すことになるのか、どんな機能をこのサービスに許可するのかといったことを確認できる画面が出てきますよね。データ分析においてもそういうベースを作っておくことは、のちのち面倒なトラブルを回避できるという点でもやっておいて損はないように思いま
 
データ分析の悪用の可能性
毎日、世界中で自動車の事故が起きます。でも自動車は現代社会に不可欠なものであるため、その事故で多少の人々が死んでしまっても、決して「じゃあ車を廃止しよう」とはなりません。それは、自動車というものが法律において「自動車は原則として誰も使用してはいけないけど、ちゃんとした技能、知識のある人に限って免許を交付することで、彼らだけは使用を例外的に許可する」というシステムだからです。(まあ実際には随分とずさんな認可ですが・・・)
データ分析の悪用と言いますが、データ分析は主に「全体の流れ」、ある集団に共通したパターンを掴むための方法であって、特定の人の趣味嗜好には何の興味もありません。ある新ドリンクAを売り込みたい時に、既存の自社商品群で得られたアンケートからフレイバー別に好みの年代・性別グループを作って、彼らのうち新ドリンクAのフレイバーに一致しそうな人を選んで売り込む、だなんていうのは、「あなたがこれを好きそうだと判断したから送りました」というだけのことです。個人情報自体を使いたいなら、わざわざ大金はたいて人数を稼ぐよりやりようがあるはずです。
 

5 SAS University Edition(SAS雲丹)のリリース

これも本当は個人的にはかなりのビッグニュースなんですが、ちょっと一般向けの話ではないので5位に。(ちなみにSAS雲丹という通称を提唱したのは私ではありませんが流行らせてゆきたいので使わせていただきます)
先日「SASが無料で使えるようになったのにどうしてRなど使う必要があるだろうか」という言及を見つけて「あーーー!!!確かにーーーー!!!!!」と思いました。ただ、個人的には初めてBase SASを使ったときの比ではないほどにちょっと使いづらいのがなんともいえないですけど。学部2年でSASとか使い始める人がいると思うと、ぼくよりちょっと下の世代からデジタルネイティブと呼ばれた時と同じような戦慄を覚えます。
そして同時にSASが教育機関向けに破格のSASパッケージをリリースして、こちらもびっくりしました。うちの研究室もこっちに移行しそうな気がします。
 

6 ニューロエボリューション

こっち方面はそんなに詳しくないので詳述はしませんが、いわゆるニューラルネットワークを遺伝的アルゴリズムを用いて最適化するようなシステムみたいですね。これだと、以前書いたITの未来について考えてみたに書いた問題点が解決されそうな感じがします。
 

7 トランセンデンス

トランセンデンスという映画でシンギュラリティが取り上げられました。詳細は長くなったので別postで書きますが、映画の評価は別として、テクノロジー面から面白かったことについて書くつもりです。
 
なんか他にもいっぱいあったような気がしますが、とりあえずこんな感じにしておきます。
 
 


 - IT, SAS, ビッグデータ, 映画, 統計学 , , , , ,

Message

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

  関連記事

no image
SASのPROC HTTPでe-statのAPIを叩く(叩くだけ)
SASでカテゴリカルな変数をダミー変数化するマクロ
no image
ビッグデータと情報売買
SAS超基礎1 データの読み書き
no image
ITの未来について考えてみた
SASで変数リスト内の全変数に順番に同じ処理をかけていくマクロ
no image
ビッグデータ分析の話
SASでディレクトリ内の全フォルダを自動でライブラリに追加する
no image
Raspberry Pi 2 Model Bを買った話 pt.1 (最初の起動まで)
no image
横行する似非統計の話