SCOPEとweka

  1. wekaダウンロード http://www.cs.waikato.ac.nz/~ml/weka/
    • linux で weka 起動まで
      	wget http://prdownloads.sourceforge.net/weka/weka-3-6-1.zip
      	unzip weka-3-6-1.zip
      	cd weka-3-6-1
      	java -jar weka.jar
  2. weka サンプル
    • サンプル作成 参考サイト
    • SCOPE関連 議員の発言内容により決定木をつくる場合
      	@relation member
      	
      	@attribute 財務(1010)	Real
      	@attribute 病院事業(1101)	Real
      	@attribute 教育(1120)	Real
      	@attribute 学校(1121)	Real
      	・・・
      	@attribute Member	{memberA,memberB,memberC,・・・}
      	
      	@data
      	0.113389626,0.031363088,・・・,0,memberA
      	0.151930262,0.078455791,・・・,0,memberB
    • 元のExcelデータ
      weka-excel.jpg
      • メモ Excelで転置
        	コピーし、「形式を選択してペースト」で、行を列の入れ替えを選択

J48 決定木の作成

  1. SCOPEのデータ作成方法
    • 各議員の発言数が異なるため正規化する
      • 各議員の発言総数で各議員のカテゴリ発言数を割る
      • 	議員Aの発言総数 1000回 議員Aの財務に関連する発言200回 の場合
        	議員Aの財務の値は 0.2 となる
    • 議員名を載せていないバージョン、arff形式のファイル
    • 議員名を載せていなるバージョン、arff形式のファイル

コマンドラインからの操作について

  1. コマンドラインからサンプル
    • コマンドラインからどのように操作するのか?