自然言語処理等で用いられる代表的な極性辞書は、「虚」がつく言葉にどんな評価を与えているのかを見てみる。
・日本語評価極性辞書
※p=ポジティブ, e=0, n=ネガティブ
---------------
虚 e 〜がある・高まる(存在・性質)
虚しさ n 〜がある・高まる(存在・性質)
虚偽 n 〜する(行為)
虚血性心疾患 n 〜である・になる(状態)客観
虚言 n 〜する(行為)
虚言癖 n 〜がある・高まる(存在・性質)
虚構 n 〜である・になる(評価・感情)主観
虚弱 n 〜である・になる(状態)客観
虚弱体質 n 〜である・になる(状態)客観
虚心 n 〜である・になる(状態)客観
虚勢 n 〜である・になる(評価・感情)主観
虚像 n 〜である・になる(状態)客観
虚脱感 n 〜がある・高まる(存在・性質)
虚報 n 〜がある・高まる(存在・性質)
虚無感 n 〜がある・高まる(存在・性質)
虚名 n 〜である・になる(状態)客観
虚妄 n 〜する(行為)
空虚 n 〜である・になる(評価・感情)主観
謙虚 p 〜である・になる(評価・感情)主観
謙虚さ p 〜がある・高まる(存在・性質)
(参考 空き p 〜がある・高まる(存在・性質))
---------------
"虚"に関連する語は、「謙虚」の意を除いて基本的にネガティブな評価を与えられている。
但し、「虚」はポジネガの一方に偏る事無く評価されており、概念としてはあくまで中立的だという位置づけをされている事が分かる。
・単語感情極性対応表
(http://www.lr.pi.titech.ac.jp/%7Etakamura/pndic_ja.html)
以下、Pythonで特定の文字列(”虚”)を含む行を抽出して出力している。
※正の値(最大1)ならばポジティブ, 負の値(最小-1)ならばネガティブ
---------------
ld = open("posinega.txt")
lines = ld.readlines()
ld.close()
for line in lines:
... if line.find("虚")>=0:
... print(line[:-1])
...
→
虚空蔵菩薩:こくうぞうぼさつ:名詞:0.978065
虚空:こくう:名詞:0.0179987
虚位:きょい:名詞:-0.0575874
虚報:きょほう:名詞:-0.0580554
虚礼:きょれい:名詞:-0.0692215
虚字:きょじ:名詞:-0.0803067
虚心:きょしん:名詞:-0.0926693
虚数:きょすう:名詞:-0.147004
虚無主義:きょむしゅぎ:名詞:-0.171917
太虚:たいきょ:名詞:-0.219967
虚心坦懐:きょしんたんかい:名詞:-0.220158
虚構:きょこう:名詞:-0.249215
虚虚実実:きょきょじつじつ:名詞:-0.255042
謙虚:けんきょ:名詞:-0.301626
虚飾:きょしょく:名詞:-0.405492
虚貝:うつせがい:名詞:-0.436548
虚栄心:きょえいしん:名詞:-0.446605
盈虚:えいきょ:名詞:-0.448251
虚辞:きょじ:名詞:-0.470334
虚無:きょむ:名詞:-0.516517
虚偽:きょぎ:名詞:-0.517434
空虚:くうきょ:名詞:-0.521638
虚誕:きょたん:名詞:-0.550424
虚無僧:こむそう:名詞:-0.554792
虚言:きょげん:名詞:-0.573839
虚妄:きょもう:名詞:-0.588668
虚実:きょじつ:名詞:-0.626911
虚仮:こけ:名詞:-0.643949
虚仮威し:こけおどし:名詞:-0.649006
虚説:きょせつ:名詞:-0.689068
虚栄:きょえい:名詞:-0.759605
虚業:きょぎょう:名詞:-0.978253
虚脱:きょだつ:名詞:-0.982488
虚像:きょぞう:名詞:-0.985245
虚勢:きょせい:名詞:-0.985985
虚:きょ:名詞:-0.986022
虚名:きょめい:名詞:-0.986071
腎虚:じんきょ:名詞:-0.989159
虚弱:きょじゃく:名詞:-0.993369
虚伝:きょでん:名詞:-0.993692
虚聞:きょぶん:名詞:-0.994879
---------------
やはり悉くネガティブな評価を下される"虚"な言葉達、哀れである。
1つ目(日本語評価極性辞書)との違いで特筆すべき点は、「虚」が非常に負の評価を与えられていること。
こういう無視出来ない差があるから、「どの極性辞書を採用するか」は重大問題。だから僕は、"虚"な情動に特化してネガポジ判定できる極性辞書、名付けて「虚性辞書」を作りたいと思う… 今のところ優先度はかなり低いけど。
「空虚」「虚無」「虚偽」が約-0.5であるのみならず、「謙虚」も約-0.3と否定的な評価値を取っている点にも注目したい。
そして見よ、「虚空蔵菩薩」は脅威のスコア0.978065。圧倒的神々しさ。ふとした時に唱えたいワードです。