TopPage

目標

  • ファイルの読み込みと書き込み
  • Mecabの利用方法
  • 単語の出現頻度
  • 共起頻度

参考サイト

  1. Python と mecab でテキストの名詞を抽出する http://speirs.blog17.fc2.com/blog-entry-31.html

サンプルプログラムを動かす

基本

  1. 2010年08月10日

参考サイト

8/11メモ(筆跡:Ashihara)

  1. nltkで使う(かもしれない)API一覧
    • Numpy:N次元行列演算、乱数生成、フーリエ変換、線形代数演算機能(インストール済み)
    • Matplotlib:グラフ表示機能(インストール済み)>>GUIじゃないと使えないかも知れません。
    • Prover9:自動定理解析機(インストールしてません)
    • MaltParser?:英語の係り受け解析機(インストールしてません)
    • MegaM:最大エントロピーモデルの解析。最尤推定、事後確率最適化など。(インストールしてません)
  2. 共起頻度のプログラムですが、こんな感じでやってみました。バグ直しました。(8/15)
    • やり方
    • [1]pythonフォルダ内にwordAnalysis.pyを作成、wordAnalysis2.pdfの内容をコピー&ペースト
    • [2]同様にpythonフォルダ内にmecab.pyを作成、mecab2.pdfの内容をコピー&ペースト
    • [3]python mecab.py とコマンドを打って実行
    • co_occurrence関数とco_occurrence2関数は同じ動作をします。2はmecabのNodeを利用しています。

木村ゼミ生限定

編集画面
ゼミ生
2017-2018年度生(11期)
石黒栞奈一宮拓海
亀井海舟佐藤栞
佐藤有希桧森拓真
藤本朱夏ホワイトジニー
増田優作谷内健太
2016-2017年度生(10期)
伊藤みき岡島健悟
小西雪葉祐川泰輝
鈴木佑菜大門拓史
田頭わかば戸嶋咲穂
中村智貴西野哲生
横山祐果川岸祐果
2015-2016年度生(09期)
浅賀七海小林真菜
西村伊央堀江知未
針生惟希村上浩太
2014-2015年度生(08期)
大石誠大野晋太朗
加藤裕樹佐々木左近
高橋理沙武田莉穂
寺島舞子畑賀大
山田修世
2013-2014年度生(07期)
加藤史織工藤智子
佐々木葉子志鎌周
高橋玄龍眈丈
中尾千咲中川玲菜
中藪大貴
2012-2013年度生(06期)
遠藤星地大野紗季
鎌田めぐみ木下和大
齋木涼介佐々木遥
佐藤優子沼澤文香
古屋真理吉田智弘
2010-2011年度生(05期)
葦原史敏伊藤大起
伊藤みどり永坂文乃
藤田航哉前多大輔
松本陵佑宮津有沙
山田亜季
2009-2010年度生(04期)
岸本隆志窪地由恵
志賀千鶴津田有子
三浦工弥
2008-2009年度生(03期)
粟津康佑井上さゆり
北崎佑樹工藤和寛
古俣優花佐川彰宏
佐藤禎洋鈴木亜衣
竹原希美藤井優作
堀公一堀内小織
米澤宏史
2007-2008年度生(02期)
佐藤健太上村佳弘
奥田啓貴小野誠
白井かずみ高井庸介
森谷亮介六渡有梨恵
若本哲平
2006-2007年度生(01期)
菅井梓渡部謙太郎
相坂真大村佳慎
奥桃子笠井猛
小林和幸齊藤いつこ
齊藤雄紀佐々木麻未
佐藤日加吏谷本貴之
徳江佑介長嶺脩平
西本みゆき林絵里子
澤田大輝

添付ファイル: filemecab.pdf 484件 [詳細] filewordAnalysis.rtf 324件 [詳細] filemecab2.pdf 1033件 [詳細] filewordAnalysis2.pdf 912件 [詳細] filemecab.rtf 366件 [詳細] filewordAnalysis.pdf 382件 [詳細]