TopPage

目標

参考サイト

  1. Python と mecab でテキストの名詞を抽出する http://speirs.blog17.fc2.com/blog-entry-31.html

サンプルプログラムを動かす

基本

  1. 2010年08月10日

参考サイト

8/11メモ(筆跡:Ashihara)

  1. nltkで使う(かもしれない)API一覧
    • Numpy:N次元行列演算、乱数生成、フーリエ変換、線形代数演算機能(インストール済み)
    • Matplotlib:グラフ表示機能(インストール済み)>>GUIじゃないと使えないかも知れません。
    • Prover9:自動定理解析機(インストールしてません)
    • MaltParser?:英語の係り受け解析機(インストールしてません)
    • MegaM:最大エントロピーモデルの解析。最尤推定、事後確率最適化など。(インストールしてません)
  2. 共起頻度のプログラムですが、こんな感じでやってみました。バグありました。修正したものを後であげます。
    • やり方
    • [1]pythonフォルダ内にwordAnalysis.pyを作成、wordAnalysis.pdfの内容をコピー&ペースト
    • [2]同様にpythonフォルダ内にmecab.pyを作成、mecab.pdfの内容をコピー&ペースト
    • [3]python mecab.py とコマンドを打って実行
    • co_occurrence関数とco_occurrence2関数は同じ動作をします。2はmecabのNodeを利用しています。