CogStructureの用途
健康診断と同じように数値で「人の思考」を表現
昨今では、何らかの重要な判断を下す際、様々なデータを用いて客観性を確保した上で行うことが企業でも個人でも当たり前になりつつあります。例えば健康診断では、血液検査などの結果が数値として表現され、医師の主観に依存しない診断が行われています。しかし、音声やテキストで表現されるコミュニケーションの領域においては測定が難しく、その当たり前ができていないことも多いのではないでしょうか。
しかし、こういった数値化が難しい定性的な情報は、コグニティ独自の知識表現(※)フレームワーク「CogStructure」を用いることで数値化が可能な定量情報に変換することができます。この変換により、一般的な統計手法から機械学習まで、様々な技術と組み合わせて「人の思考」を分析することが可能になります。
※ 知識表現=自動推論や自然言語処理と並ぶ人工知能研究領域のひとつ
CogStructureへの変換方法
作業の単純化と自動判別による知的作業工程
CogStructure変換には、それぞれ研究テーマになるほど難易度の高い要素技術群が必要となりますが、以下の方針で設計することで実現可能とし、かつ商用利用可能なレベルに落とし込んでいます。
・作業を徹底的に工程分業化し、判断基準を単純化する
・現在の技術で自動化できない作業は、人が担当する
私たちは、これを工場生産モデルの知的労働への応用と位置づけており、アウトプット精度と拡張性の双方を担保しています。また、データやノウハウの蓄積によって工場と同じような進化を遂げていくと確信しています。現在では、機械学習を組み込んだ変換工程の自動化も進んでいます。データサイエンスと合わせることで、さらなる進化が期待できます。
CogStructureを利用する強み
圧倒的に少ないサンプルから傾向を検出できる
CogStructureが持つ30以上のパラメータ特徴と、これまでに培ってきた16,000件を超えるコミュニケーションデータベースにより、他のAI企業のアプローチと比較して圧倒的に少ないサンプル数で傾向を検出することができます。国内外含め、コミュニケーションを対象とするAI技術は保有する辞書・コーパスに依存するため、特定の業種やシーンにしか対応できません。しかしCogStructureは、抽象化された情報分類が可能なため、言語や固有名詞の枠を超えて比較することが可能です。
トークの抜け漏れ/偏り/過不足検知技術(特許第6573321号、海外審査中)
解析の工程としては、まず音声をテキスト化し(※1)、人の作業による「アノテーション(※2)」と機械学習の組み合わせにより、テキストをCogStructureへ変換します。人が作業する範囲については精度の担保と生産性の維持のため、工程管理やANDON方式など日本が得意とする工場生産方式を採用。創業以来一貫して個体差や人特有のクセを取り除く工夫を行っています。2019年にはこれら一連の技術について特許(※3)を取得しています。
※1 日本語の音声認識は複雑で、複数人の会話や雑音のあるシーンはGoogleやAmazonですら精度が出せません。コグニティではこれらの精度を高めコストを担保するため、文字起こしは自社で実施しています
※2 アノテーション=データについて分類したり、機械的な処理を行う時に精度を高めたりするための前処理
※3 特許第6573321号(トークや文書の文脈・構成について差分計算し、抜け漏れ・過不足を予測/推薦する技術)