四季報をネガポジ分析する

四季報のデータをネガポジ判定してみました。

四季報の文章を、mecab形態素分析して(辞書はIPA辞書を利用)、単語感情極性対応表を利用して各単語のネガポジ値を求め、銘柄毎にその値の平均を求めました。結論から言ってしまうと、今回の方法では有効な結果は得られませんでした。

ちなみに単語感情極性対応表とは、以下のサイトよりDLできるものです。言語処理についての先生が作った辞書なんですかね。

PN Table

調べた結果の、各銘柄の値を紹介します。

例えば、任天堂(7974)

【回復歩調】ゲーム機は新型機投入に先立つ買い控えでWiiU激減、3DS続落。が、『ポケモン』等の新作ソフトが牽引し営業増益。『ポケモンGO』効果で持分法利益膨らむが為替差損重く経常益以下は減額。【GO】世界的ヒットの『ポケモンGO』は直接恩恵ないがポケモン社が得る利益の一部を持分法利益で享受。来年4月メドに国内ゲーム卸を子会社化し流通網を再編。

値は-0.429172702581515でした。

例えば、タカタ(7312)

【特損次第】海外中心にシートベルト、エアバッグとも数量堅調。だが、円高やリコール関連費用かさみ営業減益。為替差損も続く。特損拡大懸念で巨額最終赤字リスク。【胸先三寸】自動車メーカーとエアバッグ部品のリコールを巡る責任明確化と1兆円規模の費用分担を協議中。スポンサー選定や再建案策定は目標の今秋よりずれ込みも。訴訟も多数。継続前提に重要事象。

値は-0.438822088614299でした。任天堂とあまり変わらないですね。。。

最もポジティブ評価だった銘柄は伊藤忠(8001)で-0.288406368888888でした。

【最高益】資源安で金属・エネルギー低調。ただ、生産効率改善でドール回復、期中にファミマとユニーの統合効果もあり食料反発。中国複合企業CITICが通期貢献。機械で売却益。減損一巡し、最高純益。【戦略提携】CITICと資源分野での協業強化に覚書。多分野での提携案件創出を急ぐ。7月、米国空売り投資ファンド伊藤忠の不適切会計を指摘だが、全面的に否定。

最もネガティブ評価は昭和シェル(5002)で-0.542446013333333でした。

【黒字化幅縮小】上期は油価想定上振れ、在庫評価損大幅縮小。が、夏の石油製品マージン悪化で後半失速懸念。円高で太陽電池輸出採算悪化。前号比で営業黒字化幅縮小。17年12月期は石油、石化のマージン平準化。【統合目指す】出光創業家が経営統合に反対表明だが、予定どおり17年4月に出光興産と合併目指す方針。潤滑油事業は分社化で現販売体制維持。表記は統合織り込まず。

実際にポジネガの各単語での値を任天堂を例に取り取得してみると以下のようになります。 文章から名詞、動詞、形容詞、副詞のみを抽出し、単語感情極性対応表から合致する単語があった場合に値を拾ってきています。

回復 -0.134749
歩調 -0.404467
ゲーム -0.41637
機 -0.572839
新型 -0.114096
機 -0.572839
投入 -0.396697
先立つ -0.476742
激減 -0.672779
続落 -0.0943148
等 -0.560531
新作 -0.219796
ソフト -0.409824
牽引 -0.39826
営業 -0.639715
増益 -0.0398407
効果 0.938205
持分 -0.321104
法 -0.712276
利益 -0.820271
膨らむ -0.891689
為替 -0.360916
差損 -0.213611
重い -0.934531
経常 -0.476294
益 -0.421675
以下 -0.129139
減額 -0.602274
世界 -0.785992
的 -0.573711
ヒット -0.306673
直接 -0.83636
恩恵 -0.0107815
ない -0.999997
社 -0.392714
得る -0.85461
利益 -0.820271
一部 -0.904671
持分 -0.321104
法 -0.712276
利益 -0.820271
享受 0.983065
来年 -0.190089
国内 -0.463812
ゲーム -0.41637
卸 -0.384946
子会社 -0.166832
流通 -0.131717
網 -0.872901
再編 -0.106438

対応表にポケモンという単語がないので、その部分は値は取得されてませんね。また、「回復」「歩調」や「為替」「差損」といった具合に、四季報の文章を形態素分析するにあたり、適当に分かち書きできていない部分も多いです。かつ実際に「回復歩調」と1語で解析できていたとしても、対応表の方には合致する単語が登録されていないので、ネガポジ値を取得できないはずです。

結局、四季報の文章を正しくネガポジ分析するには、既存の辞書やネガポジ表を用いるのでなく、四季報用のものを自作する必要があります。 四季報の文章はある程度フォーマットが決まっているでしょうから、それらを作成するのは可能なのでしょうが。。。

ちょっとしんどすぎますね。

僕のへなちょこスクリプトのgistを載せておきます。

negative-positive analyzer script for shikiho-data