Clalisとは?

Clalisは日本語の文章を解析して理解するシステムです!

日本語を解析する機能を提供しています。
特にLiplisの情報収集に欠かせない「WEBサイト解析・要約」
キャラクターの口調を再現するための「口調変換処理」
おしゃべりに感情をもたせる「感情付与」
Liplisのニュース取得に欠かせない、「ニュース提供機能」
などがあります。
これらの一部はWebAPIとして一般に提供しています。
 
サーバーの裏側では、インターネット上にある様々なデータを収集しています。
 
このページではClalisの基本設計的な説明を書いています。
それぞれの項目から、詳細説明に移動できるようになっています。
 
 

Clalisの特徴

Clalisの主な機能は以下のとおりです。

文章の要約処理(重要文章の抽出)

大量の文章中より、重みの高い文章を抽出します。
 
 

Webサイト日本語抽出処理

Webサイトを読み込み、日本語の文章を抽出します。
 
 

文章へのメタ感情の付与

約100万語の日本語の感情辞書をもとに、感情を付与しています。
学習もかけています。日々新しい情報が追加されます。
(ただし、効果はあまりでていません・・・・。)
 
 

語尾変換

語尾変換ルールをもとに、語尾変換をして返します。
 
 

形態素解析

文章を形態素単位に分割します。
 
 

付与感情

文章を形態素解析した結果にメタ感情値を付与します。
例えば以下のような感じです。
 
感情付与前文章

 今日は天気が良い

 
感情付与後文章

 今日,0,0
 は,0,0
 天気,0,0
 が,0,0
 良い,1,10

「単語 + 感情ID + 感情値」で表現される形に変換します。
これにより、文章の印象を表現しています。

感情ID、感情値については
Liplisの感情について」で解説しています。
 
 

ClalisForLiplis

Liplisから使用される専用APIです。
Javascriptのソースを見ていただくと、一応確認できます。
 
 

Clalis Apk Build System

Liplisのスキンファイルをアップロードして、
LiplisAndroidのapkファイルを作成するシステムです。
セキュリティ上の観点から、一般公開はしていません。
 
 

Clalisのメソッドについて

今まではLiplis専用でしたが、一般的に使えるようにしました。
Clalisのコア機能である、感情付与、口調変換、ウェブ要約のメソッドを提供します。
WebからはHTTP_POST、HTTP_GET、RESTで要求できるようにしました。
出力はXMLとJSONを用意しています。
 
 

Clalis 形態素解析+

Mecabを使って分かち書きした結果を返します。
詳細仕様は「Clalis 形態素解析+」を御覧ください。
 
 

Clalis 形態素解析

Mecabを使って分かち書きし、単語と品詞のみ返します。
詳細仕様は「Clalis 形態素解析」を御覧ください。
 
 

Clalis 感情付与

文章を単語ごとに分け、各単語にメタ感情を付与して返します。
詳細仕様は「Clalis 感情付与」を御覧ください。
 
 

Clalis 口調変換

口調変換ルールファイルに基づいて口調変換を行い、結果を返します。
詳細仕様は「Clalis 口調変換」を御覧ください。
 
 

Clalis 口調変換 + 感情付与

口調変換を行い、単語に分割、各単語にメタ感情を付与して返します。
詳細仕様は「Clalis 口調変換 + 感情付与」を御覧ください。
 
 

Clalis Web日本語抽出

指定のURLのサイトから日本語の文章のみを抜き出します。
詳細仕様は「Clalis Web日本語抽出」を御覧ください。
 
 

Clalis 文章抽出

指定のURLのサイトから日本語の文章のみを抜き出し、リストにして返します。
詳細仕様は「Clalis 文章抽出」を御覧ください。
 
 

Clalis Web重要文章抽出

指定のURLのサイトから、重要度の高い順番に文章を並び替えて帰します。
詳細仕様は「Clalis Web重要文章抽出」を御覧ください。