■ 講義内使用コード
https://colab.research.google.com/drive/1iwdxeGzpxUnffM0Tk0wtzRXA3IKvTe40?usp=sharing
■ 言語処理100本ノック
https://nlp100.github.io/ja/
00:00 イントロ
01:16 事前準備
03:49 01. テキストファイルの書き出し
05:29 02. テキストファイルの読み込み
07:16 03. 形態素解析1(MeCab形式)
09:12 04. 形態素解析2(ChaSen形式)
10:34 05. 形態素解析3(わかち書き)
11:43 06. 形態素解析4(カタカナ変換)
13:18 07. 品詞ごとの分類
24:53 08. 動詞の抽出
29:09 09. 単語の出現頻度の算出
32:46 10. 頻出順に並べ替え
40:54 11. ヒストグラムで可視化
43:08 12. N-gram(文字単位)
46:42 13. N-gram(単語単位)
50:56 14. N-gramの関数化
56:30 15. 単語ベクトルの読み込み
01:00:23 16. Cos類似度
01:03:03 17. 類似度ランキング
01:04:35 18. 単語ベクトルの演算
01:07:36 19. k-meansでクラスタリング
01:18:25 20. t-SNEで可視化
#Pythonで自然言語処理 #自然言語処理20本ノック #自然言語
コメント
勉強になる~!
とても参考になりました!
N-gram 関数化間違ってますよ笑
-n-1 じゃなくて-(n-1)です