[[TopPage]] ***目標 [#j339be2b] --ファイルの読み込みと書き込み --Mecabの利用方法 --単語の出現頻度 --共起頻度 ***参考サイト [#t4179991] +Python と mecab でテキストの名詞を抽出する http://speirs.blog17.fc2.com/blog-entry-31.html~ ***サンプルプログラムを動かす [#md467ae3] -http://hp.vector.co.jp/authors/VA003670/python/ p**(ローマ字).py というファイル名 ***基本 [#f73dfd3a] +2010年08月10日 --ファイルの読み込みと書き込み --http://d.hatena.ne.jp/rokujyouhitoma/20100524/1274702655~ --Mecabの利用方法 --http://speirs.blog17.fc2.com/blog-entry-31.html~ --単語の出現頻度 --共起頻度 ***参考サイト [#x15713eb] - Python 入門編 http://www.python-izm.com/contents/external/odict.shtml - Python 入門編 参考サイト PPT(PDF) http://homepage3.nifty.com/neverplace/doc/program/python1_slide.pdf - Python 入門編 参考サイト PPT(PDF) http://www.logopt.com/mikiokubo/pythonintro.ppt - PythonRecipe http://lightson.dip.jp/zope/ZWiki/PythonRecipe ***8/11メモ(筆跡:Ashihara) [#e4e2e72f] +nltkで使う(かもしれない)API一覧 --Numpy:N次元行列演算、乱数生成、フーリエ変換、線形代数演算機能(インストール済み) --Matplotlib:グラフ表示機能(インストール済み)>>GUIじゃないと使えないかも知れません。 --Prover9:自動定理解析機(インストールしてません) --MaltParser:英語の係り受け解析機(インストールしてません) --MegaM:最大エントロピーモデルの解析。最尤推定、事後確率最適化など。(インストールしてません) +共起頻度のプログラムですが、こんな感じでやってみました。バグありました。修正したものを後であげます。 +共起頻度のプログラムですが、こんな感じでやってみました。バグ直しました。(8/15) --やり方 --[1]pythonフォルダ内にwordAnalysis.pyを作成、wordAnalysis.pdfの内容をコピー&ペースト --[2]同様にpythonフォルダ内にmecab.pyを作成、mecab.pdfの内容をコピー&ペースト --[1]pythonフォルダ内にwordAnalysis.pyを作成、wordAnalysis2.pdfの内容をコピー&ペースト --[2]同様にpythonフォルダ内にmecab.pyを作成、mecab2.pdfの内容をコピー&ペースト --[3]python mecab.py とコマンドを打って実行 --co_occurrence関数とco_occurrence2関数は同じ動作をします。2はmecabのNodeを利用しています。 #ref(mecab.pdf) #ref(wordAnalysis.pdf) #ref(mecab2.pdf) #ref(wordAnalysis2.pdf)