2015-05-01から1ヶ月間の記事一覧

Apache Drill で日本語を扱うときの注意

言語の設定がUTF-8になっている環境であれば、データに日本語が含まれていても基本的に問題はありません。 $ echo $LANG ja_JP.UTF-8 次のようなCSVファイルを $ cat /tmp/test.csv 1,くまモン,熊本 2,ふなっしー,船橋 3,せんとくん,奈良 次のSQLで取得する…

政府統計情報 e-Stat を Apache Drill で分析してみる (1)

スキーマフリーSQLクエリエンジンApache Drillがついにバージョン1.0になりました。 Apache Drill - Schema-free SQL for Hadoop, NoSQL and Cloud Storage これを機会に、Drillの得意とするJSON形式の結構複雑なデータの分析を、いろいろなオープンデータを…