- 追加された行はこの色です。
- 削除された行はこの色です。
[[TopPage]]
+wekaダウンロード http://www.cs.waikato.ac.nz/~ml/weka/
--linux で weka 起動まで
wget http://prdownloads.sourceforge.net/weka/weka-3-6-1.zip
unzip weka-3-6-1.zip
cd weka-3-6-1
java -jar weka.jar
+weka サンプル
--サンプルの作り方 http://www.mkc.zaq.ne.jp/eabeh309/weka/index.html#%E5%85%A5%E5%8A%9B%E3%83%87%E3%83%BC%E3%82%BF
--議員の場合
--サンプル作成 [[参考サイト>http://www.mkc.zaq.ne.jp/eabeh309/weka/index.html#%E5%85%A5%E5%8A%9B%E3%83%87%E3%83%BC%E3%82%BF]]
--SCOPE関連 議員の発言内容により決定木をつくる場合
@relation member
@attribute Member {MemberA, MemberB, MemberC, ...}
@attribute Category01
@attribute Category02
@attribute Category03
...
@attribute Category96
@attribute 財務(1010) Real
@attribute 病院事業(1101) Real
@attribute 教育(1120) Real
@attribute 学校(1121) Real
・・・
@attribute Member {memberA,memberB,memberC,・・・}
@data
MemberA,1,0,
MemberB,1,1,
MemberC,0,2,
MemberZ,2,2,
--Excelで転置
---コピーし、「形式を選択してペースト」で、行を列の入れ替えを選択
--作成したデータ &ref(MemberH19.txt);
0.113389626,0.031363088,・・・,0,memberA
0.151930262,0.078455791,・・・,0,memberB
--元のExcelデータ
#ref(weka-excel.jpg,,40%);
---メモ Excelで転置
コピーし、「形式を選択してペースト」で、行を列の入れ替えを選択
***J48 決定木の作成 [#l968669e]
-J48とは [[参考サイト>http://www1.doshisha.ac.jp/~mjin/R/20.pdf]]
--Quinlan の C4.5 に基づいた決定木を生成する
--デフォルトで実行すると、"J48 -C 0.25 -M 2" となっている。
---オプションCについて
Confidence Factor
剪定のための信頼要因。値が小さいほどより多く剪定される
---オプションMについて
miniNumObj
葉における最少の個体数
+SCOPEのデータ作成方法
--各議員の発言数が異なるため正規化する
---各議員の発言総数で各議員のカテゴリ発言数を割る
---例
議員Aの発言総数 1000回 議員Aの財務に関連する発言200回 の場合
議員Aの財務の値は 0.2 となる
--議員名を載せていないバージョン、arff形式のファイル
---&ref(MemberH19.txt);
---"J48 -C 0.25 -M 2" 結果
#ref(weka-1.jpg,,50%);
--議員名を載せていなるバージョン、arff形式のファイル
---&ref(MemberH19-Otaru.txt);
---"J48 -C 0.25 -M 2" 結果
#ref(weka-member.jpg,,50%);
---"J48 -C 0.25 -M 1" 結果
#ref(weka-otaru-j48-C025-M1.jpg,,50%);
+コマンドラインからサンプル
--コマンドラインからどのように操作するのか?