RNNLMベースの形態素解析器 JUMAN++ をhomebrewでインストールできるようにした

京大の黒橋・河原研から最近出たJUMAN++をmacOSのhomebrewでinstallできるようにしました。 JUMAN++はRNNLMというディープラーニングベースの言語モデルを使っています。 こちらの記事を読んで知ったという方も多いのではないでしょうか。

avatar
Aki Ariga
Read more

PDFの表をpandasのDataFrameにできる tabula-py 作った

RubyKaigiに参加するとコード書きたいという気持ちが高まって良いのですが、今回はPDFの表を読み込んで pandas の DataFrame に変換できる tabula-pyを作りました。 これをもってRubyKaigiの参加報告とさせていただければと思います。

avatar
Aki Ariga
Read more

川崎Ruby会議 01を開催しました #kwsk01

さる 8/20 に川崎Ruby会議01を開催しました。 regional.rubykaigi.org 川崎Ruby会議は、kawasaki.rbの主催する地域Ruby会議です。 ちゃんとしたまとめはるびまに出ると思うので、ここでは開催の経緯なんかを簡単に書こうと思います。

avatar
Aki Ariga
Read more

「夏真っ盛り!Spark + Python + Data Science祭り」を開催しました&Ibisを紹介しました #summerDS

2016/07/25に「夏真っ盛り!Spark + Python + Data Science祭り」を開催しました。

avatar
Aki Ariga
Read more

JupyterからSpark clusterを操作できるlivy + sparkmagicを試してみた

Spark Summit 2016でもトークがあったSparkのREST serverであるlivyですが、MicrosoftがHDInsight上のSpark clusterとJupyterをlivyを使って繋げられるようにしたと聞いて、早速試してみました。

avatar
Aki Ariga
Read more

そのモデル、過学習してるの?未学習なの?と困ったら

Q: うわっ…ワタシのモデル過学習してる…? 機械学習をしていると、「やったほぼ100%の性能でました!」みたいな話がちょこちょこでて、その度に「あー、はいはい過学習乙」とか「leakageじゃね?」とかいう話になると思います。

avatar
Aki Ariga
Read more

機械学習の分類の話を損失関数と決定境界を中心に整理してみた

機械学習の分類の話を、主に決定境界と損失関数の観点から整理してみました。 とはいっても、k-NNとか損失関数関係ないのもいます。

avatar
Aki Ariga
Read more

データを一箇所に集めることでデータ活用の民主化が進んだ話

先日、この記事を読んで分析のハードルを下げること大事だよね、というのを思い出したのでつらつらと書いてみようと思います。

avatar
Aki Ariga
Read more

転職しました

はじめての転職エントリです。 一部の方にはお伝えしましたが、先週からClouderaで働いています。

avatar
Aki Ariga
Read more

#CookpadTechConf 2016でクックパッドの研究まわりの取り組みを発表しました

1/23に開催されたCookpad TechConf 2016で、クックパッドの研究開発に関する取り組みを紹介させていただきました。

avatar
Aki Ariga
Read more