サポートシステムに文章解析を入れて、FAQを案内するシステムを開発していますと言っていましたが、
「だったら自由文で質問できるようにJSNおじさん作っちゃえばいいじゃん」
ということになりました。
社長に頼んで、MeCabを利用した名詞抜き出しまでは完成。
あとは、FAQとどのようにこの名詞を関連付けるかが問題です。
たとえば、
早速ですが質問です。 XOOPSのインストールをしているのですが、MySQLのユーザー名とパスワードがわからなくなってしまいました。再送願えますでしょうか?
とした場合、
名詞としてMeCabに抜き出されるのは以下のとおりです。
- 質問
- XOOPS
- インストール
- の
- MySQL
- ユーザー
- 名
- パスワード
- 再送
この場合、要するにユーザー名とパスワードの再送の手続きをご案内すればいいのですが、ノイズとして
XOOPS、MySQLが入ってきます。
スコアを工夫しないと、XOOPSのインストールマニュアルをご案内することになります。
これはどうやって工夫すればいいんだろう…。
ほかの品詞からも判定するほうがいいのかなぁ。
形態素分析を詳しく学ばないとダメですね…。
そういえば、はてなのAPIではてなキーワードを抜き出してくれるのがあったのですが、キーワードへのリンクを張らないといけないので一応却下しました。
もしくは、人工無能的に、もう特定のキーワードにマッチしたら文字列を返すというのも考えられます。
ただ、それは辞書の作成が死ぬほど大変です。
「ユーザー名とパスワード」がこの場合キーワードで登録されていればいいということになりますが、
「UserIDとPassword」かもしれないし、ログイン名とパスワードかもしれない。
ってそれは上も同じか。うわ。FAQのタグ付けを工夫しないとですね…。
ただね、とりあえずロリポおじさんは越えるように頑張ります。
「支払いについて教えてください」って入れても「わからないぽ」って言われるのはさすがにw