[[TopPage]]

***目標 [#j339be2b]
--ファイルの読み込みと書き込み
--Mecabの利用方法
--単語の出現頻度
--共起頻度

***参考サイト [#t4179991]
+Python と mecab でテキストの名詞を抽出する http://speirs.blog17.fc2.com/blog-entry-31.html~


***サンプルプログラムを動かす [#md467ae3]
-http://hp.vector.co.jp/authors/VA003670/python/
	p**(ローマ字).py というファイル名
***基本 [#f73dfd3a]
+2010年08月10日
--ファイルの読み込みと書き込み
--http://d.hatena.ne.jp/rokujyouhitoma/20100524/1274702655~
--Mecabの利用方法
--http://speirs.blog17.fc2.com/blog-entry-31.html~
--単語の出現頻度
--共起頻度

***参考サイト [#x15713eb]
- Python 入門編 http://www.python-izm.com/contents/external/odict.shtml
- Python 入門編 参考サイト PPT(PDF)  http://homepage3.nifty.com/neverplace/doc/program/python1_slide.pdf
- Python 入門編 参考サイト PPT(PDF)  http://www.logopt.com/mikiokubo/pythonintro.ppt
- PythonRecipe http://lightson.dip.jp/zope/ZWiki/PythonRecipe

***8/11メモ(筆跡:Ashihara) [#e4e2e72f]
+nltkで使う(かもしれない)API一覧
--Numpy:N次元行列演算、乱数生成、フーリエ変換、線形代数演算機能(インストール済み)
--Matplotlib:グラフ表示機能(インストール済み)>>GUIじゃないと使えないかも知れません。
--Prover9:自動定理解析機(インストールしてません)
--MaltParser:英語の係り受け解析機(インストールしてません)
--MegaM:最大エントロピーモデルの解析。最尤推定、事後確率最適化など。(インストールしてません)
+共起頻度のプログラムですが、こんな感じでやってみました。バグありました。修正したものを後であげます。
+共起頻度のプログラムですが、こんな感じでやってみました。バグ直しました。(8/15)
--やり方
--[1]pythonフォルダ内にwordAnalysis.pyを作成、wordAnalysis.pdfの内容をコピー&ペースト
--[2]同様にpythonフォルダ内にmecab.pyを作成、mecab.pdfの内容をコピー&ペースト
--[1]pythonフォルダ内にwordAnalysis.pyを作成、wordAnalysis2.pdfの内容をコピー&ペースト
--[2]同様にpythonフォルダ内にmecab.pyを作成、mecab2.pdfの内容をコピー&ペースト
--[3]python mecab.py とコマンドを打って実行
--co_occurrence関数とco_occurrence2関数は同じ動作をします。2はmecabのNodeを利用しています。
#ref(mecab.pdf)
#ref(wordAnalysis.pdf)
#ref(mecab2.pdf)
#ref(wordAnalysis2.pdf)