[[自然言語処理]] +CGI関連 サンプルスクリプト --[[Perl/CGIを利用したGET方式]] --[[Perl/FORMの入力画面]] HTMLのFORM --[[useCGIを利用したPOST方式]] --[[useCGIを利用したPOST方式+LOGの書き込み]] --[[Yahoo!APIを利用する]] --[[Perl/MySQLからデータを抽出する]] --[[Perl/MySQLに格納するためのsqlファイル作成]] --[[Perl/MySQLに格納されたブログデータを表示]] --[[Perl/linuxで複数ファイルの文字コード変換]] --[[Perl/再帰読み込みで、ファイルサイズを計算する]] --[[PerlでHyperEstraierの検索結果を表示する]] --[[Perl/全角数字を半角数字へ変換する]] --[[Perl/CRF++データへの変換]] --[[Perl/複数ファイルの単語出現頻度を求める]] --[[Perl/ウェブサーバのアクセスログからクエリの解析]] --[[Perl/組み合わせ]] --[[Perl/名詞句AのB抽出方法]] --2009年7月「小樽」を含むブログ収集件数164,503件のBlogをDBへ格納する +今後作成するスクリプト --[[XMLを読み込みDBへ出力するスクリプト]] --[[Perl/MySQLに格納されたデータをXML形式で出力する]] --[[Perl/MySQLに格納されたwikipediaデータを抽出する]] --[[Perl/ブログデータの収集法法]] +講義関連のスクリプト --年齢当て http://nlp.kimura-s.otaru-uc.ac.jp/InformationProcessing/HowOldAreYou.cgi ---[[年齢当て]] --投稿時間、アクセスIP、ブラウザの取得 --[[2進数、8進数、10進数、16進数の変換]] +Perlで文字コード ^Mの削除 s/\r\n/\t\n/g; +形態素解析 --chasenのオプション chasen -i w -F "%m:%H " --Mecabのオプション mecab -O wakati ---http://blog.myfinder.jp/2008/12/leopardmecab.html +エラーの対処方法 --Mecab モジュールインストールエラー ---MeCab: libmecab.so.1: 共有オブジェクトファイルを開けません ---[[参考頁>http://www.kusu.jpn.ch/blog/2009/02/02/%E5%85%B1%E6%9C%89%E3%82%AA%E3%83%96%E3%82%B8%E3%82%A7%E3%82%AF%E3%83%88%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB%E3%82%92%E9%96%8B%E3%81%91%E3%81%BE%E3%81%9B%E3%82%93%E3%81%A8%E8%A8%80%E3%82%8F%E3%82%8C/]] # vi /etc/ld.so.conf.d/mecab.conf <--新規作成 /usr/local/lib <--追加して保存 # /sbin/ldconfig <-- 反映