2010年08月10日Python勉強会のバックアップ(No.6) - Kimura seminar in Otaru University of Commerce

[ トップ ] [ 新規 | 一覧 | 単語検索 | 最終更新 | ヘルプ ]

バックアップ一覧
差分を表示
現在との差分を表示
ソースを表示
2010年08月10日Python勉強会へ行く。
- 1 (2010-08-10 (火) 03:45:44)
- 2 (2010-08-10 (火) 06:44:11)
- 3 (2010-08-10 (火) 08:36:33)
- 4 (2010-08-11 (水) 08:50:36)
- 5 (2010-08-11 (水) 12:09:10)
- 6 (2010-08-15 (日) 08:02:26)

目標 †

ファイルの読み込みと書き込み
Mecabの利用方法
単語の出現頻度
共起頻度

参考サイト †

Python と mecab でテキストの名詞を抽出する http://speirs.blog17.fc2.com/blog-entry-31.html

サンプルプログラムを動かす †

http://hp.vector.co.jp/authors/VA003670/python/

	p**(ローマ字).py というファイル名

基本 †

2010年08月10日
- ファイルの読み込みと書き込み
- http://d.hatena.ne.jp/rokujyouhitoma/20100524/1274702655
- Mecabの利用方法
- http://speirs.blog17.fc2.com/blog-entry-31.html
- 単語の出現頻度
- 共起頻度

参考サイト †

Python 入門編　http://www.python-izm.com/contents/external/odict.shtml
Python 入門編　参考サイト PPT(PDF) http://homepage3.nifty.com/neverplace/doc/program/python1_slide.pdf
Python 入門編　参考サイト PPT(PDF) http://www.logopt.com/mikiokubo/pythonintro.ppt
PythonRecipe? http://lightson.dip.jp/zope/ZWiki/PythonRecipe

8/11メモ（筆跡：Ashihara) †

nltkで使う（かもしれない）API一覧
- Numpy：N次元行列演算、乱数生成、フーリエ変換、線形代数演算機能（インストール済み）
- Matplotlib：グラフ表示機能（インストール済み）>>GUIじゃないと使えないかも知れません。
- Prover9：自動定理解析機（インストールしてません）
- MaltParser?：英語の係り受け解析機（インストールしてません）
- MegaM：最大エントロピーモデルの解析。最尤推定、事後確率最適化など。(インストールしてません）
共起頻度のプログラムですが、こんな感じでやってみました。バグありました。修正したものを後であげます。
- やり方
- [1]pythonフォルダ内にwordAnalysis.pyを作成、wordAnalysis.pdfの内容をコピー＆ペースト
- [2]同様にpythonフォルダ内にmecab.pyを作成、mecab.pdfの内容をコピー＆ペースト
- [3]python mecab.py とコマンドを打って実行
- co_occurrence関数とco_occurrence2関数は同じ動作をします。2はmecabのNodeを利用しています。
  mecab.pdf
  
  wordAnalysis.pdf