自然言語処理ブログ

自然言語処理をマーケティングに役立てたいブログです

sakuraのvpsにtensorflowを入れた

こんにちは、お久しぶりです。

hashtakeです。

 

最近、Bot界隈が盛り上がっていますね。慌ててtensorflowをsakuraにインストールしてみた次第でございます。

結果から言いますと、centos7にするとスムーズにインストールできました。

ネットで見つかるブログを参考にcentos6でインストールしようとすると、コマンドの途中でエラーになったりします。はまります。

 

なので、カスタムインストールでcentos7でインストールできましたよと。

カスタムインストールの方法はオフィシャルのsakuraブログに書いてありました。

 

bot作るぞーーーー\(^o^)/

 

word2vecをインストールして実行してみる

こんにちは

自然言語処理に興味のあるhashtakeです

 

word2vecをとりあえずインストールして実行してみました

わかち書きとか学習とか、こんがらがってきたので一度整理するという意味で、とりあえずword2vecをインストールして動かすところまでやってみました。

結果、わかち書きがどんなものなのか、どんなコマンドを実行してword2vecを実行できる状態にするかが分かったのでよかったです

 

助けられました

aipacommander.hatenablog.jp

blog.tottokug.com

 

オプションの意味の説明があります

qiita.com

ポイント

  • makeでつまづくので要注意。
  • わかち書き(コーパス)は文字ファイル。大容量
  • word2vecコマンドは時間がかかる。MBAで1時間弱。やってる時はブラウザ重くなる。

とかとか。

 

次は、日本語の解析に入れそう

楽しみです

word2vecに学習させる

こんにちは

自然言語処理に興味のあるhashtakeです

 

word2vecを扱うには「学習」させる必要があるらしいですよ

word2vecで利用する「モデル」を作るために、mecabの「わかち書き」で「学習」させるのです

モデルは解析の元になるもの、学習はword2vecのコマンドだと思います

わかち書きというのは文章を意味のある単語で区切ったものです

なのでmecab辞書を作る必要があったのですね

 

moguranosenshi.hatenablog.com

antibayesian.hateblo.jp

 

もう少しでword2vecを扱えそうです

楽しみです

mecabにwikipediaとはてなキーワードを理解させる

こんにちは

めかぶは鰹節と醤油を少しいれて食べます

 

word2vecで解析するのに、mecabが必要でさらに名詞などを理解させる必要があります。素のmecabだと新しくできた名詞など上手に解析できないのですね。

 

sugamasao.hatenablog.com

 

こちら参考にやったらそのままできました、ありがとうございます

次はいよいよword2vecで解析なるか

 

楽しそうです

 

word2vecの理解を深めるスライド

こんにちは

自然言語処理に興味のあるhashtakeです

 

word2vecでチュートリアルを始めようとググっておりましたら、理解が深まりそうなブログを見つけました。CA様ありがとうございます。

 

adtech.cyberagent.io

 

数式でてくるとえげつないです

次はチュートリアル始めます

 

楽しそうです

word2vecで出来る事

こんにちは

自然言語処理に興味のあるhashtakeです

 

word2vecで出来る事ってなんだろう

という疑問から、何ができるか調べてみました

以下なるほどなという部分の抜粋です

Word2Vecでは各単語を200次元くらいの空間内におけるベクトルとして表現する。

その結果、今まで分からなかったり精度を向上するのが難しかった単語同士の類似度や、単語間での加算・減算などができるようになり、単語の「意味」を捉えられるようになった。

mecab - 米googleの研究者が開発したWord2Vecで自然言語処理(独自データ) - Qiita

 

「同じ文脈で利用される単語は、同じ意味を持つ」という仮説に基づき、「単語」の特徴をベクトルで表現する技術となっている。

意味的に近い単語は、空間上で近くに存在するベクトルとして表現されることから、類義語の抽出に用いられている。また、ベクトルで表現されるため、単語同士の引き算や足し算が可能なことが興味深い技術である。

Apache Sparkで始めるお手軽機械学習(Word2Vec編) | NTTデータ先端技術株式会社

 

なるほど、すごそうですね

単語をベクトルで表現できるという事は、文章をベクトルで表現できるという事ですよね、ベクトルね

word2vecでできる事→精度の高い文章の解析。という事でしょうか

 

楽しそうです

 

word2vecで始める自然言語処理

こんにちは

自然言語処理に興味のあるhashtakeです

自然言語処理についてあれこれ調べた事をまとめるよ

よろしくね

 

始めに読む参考サイト

qiita.com

bugrammer.hateblo.jp

qiita.com

 

楽しそうです