2015-01-01から1年間の記事一覧

PythonでN-gramを取り出す

スライシングを使うことで、PythonでN-gramを1行で取り出せる。入力を単語区切りのリストで与えると、bigramは次のように取り出せる。 input_list = ['This', 'is ', 'a', 'pen'] bigram_list = zip(input_list, input_list[1:])trigramはこう。 trigram_lis…

libSVMで "Model supports probability estimates, but disabled in predicton." という警告が出る

libSVMのpythonモジュールで確率付き多値分類したときに詰まった話。 予測の時に各ラベルの確率が欲しい場合、オプション"-b 1"を指定すれば良いとあったので、svm_problemのところに"-b 1"を加えた。 import svm import svmutil train_data = [[1,0,1], [-1…