[[研究テーマ]]
***平成19年小樽市会議録を対象とした「名詞句AのB」についての調査 [#f7dd3160]
-「名詞句AのB」について
--特徴的な政治的問題を抽出する
--質問文はある程度抽象化され,ある程度具体的な表現でなければならない

***ブログに含まれる「AのB」 [#kc5200a2]
***ブログに「AをBする」の抽出 [#u34a8951]

***平成19年小樽市会議録を対象とした「AのB」についての調査 [#f7dd3160]
+平成19年小樽市議会会議録に含まれる「AのB」
--http://nlp.kimura-s.otaru-uc.ac.jp/NLP-research/SCOPE/20090924-AnoB.txt
+平成19年小樽市議会会議録に含まれる「名詞句AのB」
--http://nlp.kimura-s.otaru-uc.ac.jp/NLP-research/SCOPE/20090924-AnoB-Simple.txt
	14,336パターン
+分類語彙表で 「A」と「B」のタイプを調べる。 
--詳細バージョン http://nlp.kimura-s.otaru-uc.ac.jp/NLP-research/SCOPE/20090924-AnoB_BGHver1.txt
--頻度計算バージョン http://nlp.kimura-s.otaru-uc.ac.jp/NLP-research/SCOPE/20090924-AnoB_BGHver2.txt
--頻度計算上位1件バージョン http://nlp.kimura-s.otaru-uc.ac.jp/NLP-research/SCOPE/20090924-AnoB_BGHver3.txt
--(主体)→(活動)のみのバージョン http://nlp.kimura-s.otaru-uc.ac.jp/NLP-research/SCOPE/20090924-AnoB_BGHver4.txt
---http://nlp.kimura-s.otaru-uc.ac.jp/NLP-research/SCOPE/20090924-AnoB.txt
+【提案1】分類語彙表の利用  
--[[「A」と「B」のタイプをチェック A=主体 B=活動 のみのバージョン>http://nlp.kimura-s.otaru-uc.ac.jp/NLP-research/SCOPE/20090924-AnoB_BGHver4.txt]]
	616パターン
+Google 7grams を利用したチェッック
--「AのB」を「AをBする」に変換して頻度を調べる。
--検索結果全て出力 http://nlp.kimura-s.otaru-uc.ac.jp/NLP-research/SCOPE/20090924-AnoB_GoogleVer1.txt
--Google 7 gram に存在する http://nlp.kimura-s.otaru-uc.ac.jp/NLP-research/SCOPE/20090924-AnoB_GoogleVer2.txt
---詳細バージョン http://nlp.kimura-s.otaru-uc.ac.jp/NLP-research/SCOPE/20090924-AnoB_BGHver1.txt
---頻度計算バージョン http://nlp.kimura-s.otaru-uc.ac.jp/NLP-research/SCOPE/20090924-AnoB_BGHver2.txt
---頻度計算上位1件バージョン http://nlp.kimura-s.otaru-uc.ac.jp/NLP-research/SCOPE/20090924-AnoB_BGHver3.txt
+【提案2】Google N-gramの利用
--[[「AをBする」に言い換えた表現が,Google7-gram に存在するか確認する>http://nlp.kimura-s.otaru-uc.ac.jp/NLP-research/SCOPE/20090924-AnoB_GoogleVer2.txt]]
	805パターン
+一分類語意表とGoogle7gmsで一致しているパターンと一致していないパターンの割合
--http://nlp.kimura-s.otaru-uc.ac.jp/NLP-research/SCOPE/20090924SameOrNot.txt
--分類語彙表(主体-活動) 616パターン と Google7gram(AをBする) 805パターン の パターン一致数
---[[全ての結果>http://nlp.kimura-s.otaru-uc.ac.jp/NLP-research/SCOPE/20090924-AnoB_GoogleVer1.txt]]
+【提案1】分類語彙表と【提案2】GoogleN-gamの違い
--[[分類語彙表(主体-活動) 616パターン と Google7gram(AをBする) 805パターン の 一致数>http://nlp.kimura-s.otaru-uc.ac.jp/NLP-research/SCOPE/20090924SameOrNot.txt]]
	53パターン
+今後の課題
--数値表現は削除する。
+【正解】窪地さんが「名詞句AのB」を3つの観点から評価 16点を正解
--http://nlp.kimura-s.otaru-uc.ac.jp/NLP-research/SCOPE/20090924-AnoB-Kubochi-Seikai.txt
	5686/14336
---評価項目
    質問文として  成り立たない場合→0   成り立つ場合→1
    曖昧<- 1 2 3 4 5 ->明瞭
    冗長(無駄に長い)<- 1 2 3 4 5 -> 簡潔
    読みづらい <- 1 2 3 4 5 -> 読みやすい
+【評価】
--[[Google 評価>http://nlp.kimura-s.otaru-uc.ac.jp/NLP-research/SCOPE/20090924-AnoB_GoogleVer2-Result.txt]]
	再現率 387/5686 = 6.80%
	適合率 387/805 = 48.07%
--[[分類語彙表 評価>http://nlp.kimura-s.otaru-uc.ac.jp/NLP-research/SCOPE/]]
	再現率 139/5686 = 2.44%
	適合率 139/616 = 22.56%
***各カテゴリの例 [#k66dd13b]
-1010    財務      財政の健全化,地方財政の現状,国の配分方法,市政の運営,予算の編成
-1120    教育      教育費の父母負担軽減,ゆとり教育の見直し,道徳教育の充実,子供たちの学力向上
-2013    廃棄物     がれき類等の搬入,ごみ出しルール,家庭ごみの減量化,資源物の収集量
-3014    農業      農業委員会の廃止,農地の転用,農業の経営,日本の食糧自給率,都市近郊型の農業
-3051    バス      バス路線の展望,バス事業者の負担割合,バスのターミナル,路線バスの市民要望
-4020    道路      市の管理道路,市道の改良工事,市道の廃止,高速道路の通行止め
-4110    住宅      耐震補強の設計,家賃の問題,市営住宅の管理,空き戸数の割合