Abstract

PROBLEM TO BE SOLVED: To provide a method for identifying potential recipient candidate of a message in a user-friendly manner as much as possible.

SOLUTION: The message includes a text message, and the message is in electronic form. The content of the message undergoes a text analysis, and based on the result of the text analysis, a potential recipient candidate or a group of potential recipient candidates are identified from a list of recipients. Specifically, features are extracted from the analyzed message, and these features are compared to and combined with features of potential recipient candidates. By doing so, a classification can be performed, and in the optimum case, the recipient can be identified who is most probably the recipient of the analyzed message. The extraction and/or classification of features can be performed by a multitude of analysis algorithms or classification algorithms.

COPYRIGHT: (C)2007,JPO&INPIT

Description

Translated from Japanese

本発明は、メッセージの受信者候補を識別する方法および装置に関する。 The present invention relates to a method and apparatus for identifying potential recipients of the message.ここでメッセージは基本的にテキストメッセージを含み、また、メッセージは電子的形態である。 Here the message basically comprises a text message and the message is an electronic form.

書面のメッセージは、人間のコミュニケーションにとって一般的で重要なツールである。 Written message is a common and important tool for human communication.手紙、ファクス等の形態の印字されたメッセージの他に、電子的形態のメッセージの数が増加している。 Letters, in addition to the printed message in the form of a fax or the like, the number of electronic form of messages has increased.例えば電子メール（ｅメール）、ＳＭＳ（ショートメッセージサービス）、インスタントメッセージング、あるいはインターネットのフォーラムが挙げられる。 For example, an electronic mail (e-mail), SMS (short message service), and instant messaging or Internet forums.それぞれのメッセージは、作成者によって作成され、１または複数の受信者へ送信される。 Each message is created by the creator and sent to one or more recipients.送信のためには、受信者のそれぞれの正しい識別子が必要である。 For transmission, it is necessary to respectively valid identifier of the recipient.電子メールの場合には正しい電子メールアドレスを入力しなければならず、ＳＭＳの場合には対応する電話番号を入力しなければならない。 Must enter the correct e-mail address in the case of e-mail, in the case of SMS must enter the corresponding telephone number.

それぞれの識別子の入力を簡略化するため、電話帳やアドレス帳が一般に用いられる。 To simplify the input of the respective identifier, phone book, address book it is generally used.ここで、識別子は、リスト、データベース等に一度登録される。 Here, the identifier list, is once registered in a database or the like.保存されている情報を読み出す際には、要求されたエントリのみを電話帳／アドレス帳から選択する必要がある。 When information is stored, it is necessary to select only requested entry from the phonebook / address book.電話帳／アドレス帳に多数のエントリがある場合、正しい受信者識別子の検索には時間がかかることがある。 If there is a large number of entries in the phone book / address book, in search of the correct recipient identifier it can be time consuming.

このため、現在利用可能な電子メールプログラムの多くは、電子メールアドレスの自動補完機能を備えている。 For this reason, many of the currently available e-mail program, has an automatic completion of the e-mail address.ユーザは、アドレスフィールドに電子メールアドレスの最初の数文字を入力すれば、入力した文字列で始まるアドレス候補がプログラムから示される。 The user, by entering the first few letters of the e-mail address into the address field, address candidates that begin with the input string is shown from the program.しかしこの場合、ユーザは、それぞれのアドレスをかなり正確に知っていなければならないという問題がある。 However, in this case, the user, there is a problem that each of the address must be known fairly accurate.

電子メールアドレスの作られ方はさまざまなので、アドレスを正確に知っていることは困難となるであろう。 Since the e-mail made on how the address is a wide variety, that know exactly the address would be difficult.また、ある特定の電子メールアドレスがユーザによって利用されるのが極めてまれな場合、ユーザはそのアドレスを覚えていないであろうから、この自動補完は実際には役に立たなくなる。 Also, if a particular e-mail address is extremely rare that is utilized by the user, the user because it will not remember the address, the autocomplete useless in practice.さらに、このような自動補完では、表示されたエントリが期待したエントリに似ている場合には、ユーザが文字を見過ごしがちなので、誤りを生じやすい。 In addition, in such auto-complete, if you are similar to the entry of entry that is displayed has been expected, since the user is apt to overlook the character, and error-prone.急いでいる場合には、電子メールが意図せずに誤った受信者へ送信されてしまうことが起こり得る。 When in a hurry, it may occur that will be sent to the recipient that the email wrong unintentionally.

そこで、本発明は、上記のような方法において、１または複数の受信者を選択する際にできるだけ使いやすくユーザフレンドリで誤り検出を行う形で受信者候補を識別する方法を実現し、さらに改良するという課題を解決しようとするものである。 Accordingly, the present invention provides a method as described above, to implement a method for identifying a potential recipients in the form of performing error detection as much as possible easy to use user friendly in selecting one or more recipients, further improving it is intended to solve the problem.

本発明によれば、上記の課題は請求項１に記載の特徴を備えた方法によって解決される。 According to the present invention, the above object is achieved by a method having the features of claim 1.これによれば、本方法は、メッセージの内容をテキスト解析し、テキスト解析の結果に基づいて、受信者リストから受信者候補または受信者候補グループを識別することを特徴とする。 According to this, the method the contents of the message and text analysis, based on the results of text analysis, and wherein the identifying potential recipients or recipient candidate group from the recipient list.

本発明により初めて認識されたこととして、各メッセージはそれぞれの受信者に応じてスタイルおよび件名が異なるため、受信者候補を識別する際にこの情報を考慮することができる。 It has first been recognized that the present invention, each message for style and subject are different according to each recipient, it is possible to take this information into account when identifying potential recipients.ビジネス通信文はどちらかといえばよりフォーマルなスタイルであることが多く、仕事固有の内容に言及しているであろう。 Many possible business communication statement is a more formal style if anything, would be referred to the work-specific content.また、取引先宛の通信文は、同僚へのメッセージよりもフォーマルであろう。 In addition, communication statement addressed to the customer will be formal than the message to a colleague.このような相違は私生活でも生じる。 Such a difference also occurs in private life.

本発明により認識されたこととして、受信者候補を識別するためにこの情報を考慮することができる。 As it has been recognized by the present invention, it is possible to consider this information in order to identify the potential recipients.このために、メッセージの内容をテキスト解析し、テキスト解析の結果を用いて１または複数の受信者候補を識別する。 For this, the content of the message text analysis to identify one or a plurality of potential recipients using the results of text analysis.この目的のため、対応して、受信者または受信者グループを受信者リストから選択する。 For this purpose, correspondingly, to select a recipient or group of recipients from the recipient list.

本明細書において、受信者リストという用語は一般的用語として理解されなければならない。 As used herein, the term recipient list must be understood as a general term.リストとは、個々の連絡先情報の一覧のみを意味することも可能であるが、電話帳、アドレス帳、アドレスデータベース、あるいはその他の連絡先識別子を保存する手段も含み得る。 The list, but it is also possible to refer only to a list of individual contact information, phone book, address book, may also include means for storing the address database or other contact identifier,.同様に、「アドレス」あるいは「識別子」という用語は、受信者を一意的に識別するのに適したいかなる可能性も意味し得る。 Similarly, the term "address" or "identifier" may also mean any possibility suitable to uniquely identify the recipient.これに含まれるものとして、例えば、電話番号、携帯電話番号、電子メールアドレス、インターネットフォーラムでの識別子、インスタントメッセージング識別子等が挙げられる。 Included in this, for example, telephone number, mobile phone number, e-mail address, an identifier of the Internet forums, instant messaging identifier, and the like.

有利な点として、メッセージの個々の特徴がテキスト解析により抽出される。 Advantageously, individual features of the message are extracted by the text analysis.本明細書において特徴とは、メッセージのさまざまな特性を意味し得る。 The feature herein, may mean various characteristics of the message.例えば特定の単語の出現を検索することができる。 For example, it is possible to find the next occurrence of a particular word.例えば、メッセージが会議に関する意見を含む場合、このことは、ビジネス関係のメッセージであることを強く示唆する。 For example, if the message contains an opinion on the conference, this strongly suggests that it is a message of business relations.また、かなりインフォーマルなスタイルが用いられている場合、同僚とのミーティングに関するものである可能性が高い。 In addition, considerable if the informal style is used, there is a high possibility that those about the meeting with colleagues.さらに、特定の挨拶あるいは結びの句を検索することも可能である。 Furthermore, it is also possible to search for phrases of a particular greeting or knot.対応する受信者を特徴づけるその他の性質も同様に特徴として使用可能である。 Other properties characterizing the corresponding recipient can also be used as a feature as well.例えば、文の最大長や平均長をチェックしてもよい。 For example, it is also possible to check the maximum length and the average length of the sentence.

私生活では一般に、ビジネスの場合よりも短い文が作成される。 In general, in private life, short sentences are created than in the case of the business.また、例えば、最大または平均の単語長、メッセージの特定の構成、署名の使用、ワードラップの個数等の特徴も重要となり得る。 Further, for example, maximum or average word length, the specific structure of the message, using the signature, features such as the number of word wrap may also be important.

すべての特徴は、それぞれのメッセージ作成者に応じて変わり得る。 All of the features may vary depending on each of the message creator.各ユーザは、メッセージを書く際にある一定の慣習を満たすであろうが、それでもなお特定の個性を示すであろう。 Each user will satisfy certain practices that when writing a message, but still will exhibit a particular personality.したがって、テキスト解析は、共通して用いられる特徴の他に、ユーザ固有の特徴も参照することができる。 Thus, text analysis, in addition to the features used in common, it is possible to see also user-specific features.

次に、解析したメッセージから抽出したこれらの特徴を、受信者候補の特徴と比較して組み合わせることができる。 Then, these features extracted from the message analysis, can be combined as compared to the characteristics of the potential recipients.これにより分類を実行し、理想的には、解析したメッセージの受信者である確率が最も高い受信者を識別できる。 Thus running the classification, ideally, can identify the highest recipient probability is recipient of messages analyzed.特徴の抽出および／または分類は、多数の解析アルゴリズムや分類アルゴリズムによって実行できる。 Extraction of features and / or classification may be performed by a number of analysis algorithms and classification algorithm.好ましくは、機械学習アルゴリズムが適用される。 Preferably, the machine learning algorithm is applied.例えば、本方法を限定するものではないが、ニューラルネットワーク、サポートベクターマシン、ＭＦＵ（Most Frequently Used：最大使用頻度）アルゴリズム、あるいはベイジアンクラシファイア（Bayesian classifier、後述する。）の使用が挙げられる（非特許文献１〜５参照）。 For example, but not limited to the method, a neural network, support vector machines, MFU (Most Frequently Used: up frequently used) algorithm or Bayesian classifier (. Which Bayesian classifier, described below) can be mentioned are (non-patent use, references 1-5).利用可能な計算パワー、抽出すべき特徴の数、識別された受信者候補に要求される精度等の補助条件に応じて、対応する適当なアルゴリズムを選択することができる。 Available computational power, the number of features to be extracted, in accordance with the auxiliary conditions accuracy and the like required for the identified potential recipients can select the corresponding appropriate algorithm.また、動作状況によって切替可能な複数のアルゴリズムの適用も考えられる。 It is also conceivable application of switchable plurality of algorithms depending on operating conditions.

ベイジアンクラシファイアを用いる場合、計算可能性を向上させるためには、ナイーブベイジアンクラシファイアを使用するのが賢明である。 When using a Bayesian classifier, in order to improve the computability, it is advisable to use a naive Bayesian classifier.古典的なベイジアンクラシファイアとは異なり、ナイーブベイジアンクラシファイアの場合には、個々の特徴が互いに依存しているとはみなされないため、ベイジアンクラシファイアの計算公式における条件付き確率がそれぞれの特徴のみに依存する個々の条件付き確率に分解する。 Individual Unlike classical Bayesian classifier, in the case of naive Bayesian classifier, since not considered individual features are dependent on each other, the conditional probability in Bayesian classifier computation formula is dependent only on each feature decomposed into conditional probability of.この仮定は現実にはめったに成り立たないとしても、ナイーブベイジアンクラシファイアは実際には良好な結果を達成することが多い。 Even if this assumption is not in reality rarely hold, naive Bayesian classifier is often to achieve good results in practice.これは、個々の特徴の相関があまり高くない場合である。 This is the case where the correlation of individual features is not very high.また、メッセージに関して、個々のテキスト特徴は完全には互いに独立でない。 Further, with respect to the message, the individual text features are not completely independent of one another.しかし、特徴は十分に無相関であるので、ナイーブベイジアンクラシファイアの適用が正当化される。 However, since the characteristics are sufficiently uncorrelated, the application of naive Bayesian classifier is justified.

すべての既知の解析および／または分類アルゴリズムは、メッセージおよび受信者の既に計算された、そして好ましくは検証された相互相関から得られる知識を参照することで共通している。 All known analysis and / or classification algorithm was already computed message and recipient, and preferably have in common by referring to the knowledge obtained from the cross-correlation it has been verified.好ましくは、この知識は学習によって生成される。 Preferably, this knowledge is generated by learning.このためには、ユーザによって書かれた個々のメッセージは、テキスト解析してユーザが手動選択した受信者とマッチングさせることによって学習に使用される。 For this purpose, individual messages written by the user is used for learning by the recipient matched user by text analysis is manually selected.

良好な分類結果を達成するためには、学習は一般に比較的多数のメッセージを必要とするので、システムもまた、ユーザによって既に書かれたメッセージで学習し、これにより受信者リストからの１または複数の受信者との相関をとることができる。 To achieve good classification results, since learning generally requires a relatively large number of messages, the system also learns the message already written by the user, one or more from the recipient list by this it can be correlated with the recipient.新たに書かれたメッセージを使用することで知識は連続的に増大するため、この知識に基づく解析および／または分類はより良好な結果を与え、ユーザの習慣の変化に適応する。 Since knowledge increases continuously by using newly written messages, analysis and / or classified based on this knowledge gives better results, to adapt to changes in the habits of the user.

特に、受信者に対する通信挙動が変化し得ることに関して、古い知識よりも新しい知識のほうに、より多く重み付けすることができる。 In particular, in terms of communication behavior for the recipient can be changed, it is possible to more new knowledge than the old knowledge, weighting more.例えば、取引先との間で、より個人的な関係が形成される可能性があるが、それによりメッセージの構造はよりインフォーマルになる。 For example, between business partners, there is a possibility that more personal relationship is formed, but the structure of the message is more informal.この場合、ユーザの変化した挙動を重視することができる。 In this case, it is possible to emphasize the changed behavior of the user.受信者候補の識別に対し、新しい知識のほうがより強い影響を及ぼす。 For the identification of potential recipients, more of new knowledge is stronger influence.

知識を確立する際の手間をさらに低減するため、ほとんどすべてのメッセージ作成者で生じる諸特徴を基本知識に含めることができる。 To further reduce the effort in establishing knowledge can include various features that occurs in almost all the message creator to the basic knowledge.この基本知識は、事前学習として使用され、または稼働中のシステムに直接入力されることが可能である。 This basic knowledge is used as a pre-training, or can be entered directly into the running system.

本発明による方法の最初の利用の効率をさらに向上させるため、ユーザが受信者リストに受信者を入力する際に、ユーザに対して、その受信者に関する詳細事項を提示するよう促すことができる。 To further improve the initial efficiency of utilization of the method according to the invention, when the user inputs the recipient to the recipient list, the user can be prompted to present details regarding the recipient.この詳細事項としては、例えば、それぞれの受信者のカテゴリ（取引先、同僚、プライベート、友人、家族等）が挙げられる。 As the details, for example, of each of the recipient category (business partners, co-workers, private, friends, family, etc.).また、ユーザに対して、受信者リスト内の既存のエントリを同様に分類するよう要求してもよい。 Further, the user may request to classify similarly an existing entry in the recipient list.これにより、最初の選択がメッセージの簡単な解析により実行でき、多くの受信者を非常に早い段階で除外することができる。 Thus, the first selection can be performed by simple analysis of the message, it can be excluded at a very early stage a number of recipients.

こうして、最も確率の高いメッセージ受信者を識別することができる。 Thus, it is possible to identify the most probable message recipient.他方、これらの受信者は、解析されたメッセージの受信者である確率が比較的低いと識別することも可能である。 On the other hand, these recipients may also be probability of the recipient of the analyzed message to identify relatively low.

このようにして識別された受信者をユーザに対して提案として表示することができる。 Thus the recipient has been identified can be displayed as a suggestion to the user.提案される受信者は、その確率に従ってソートして表示することができる。 Proposed recipient can be displayed sorted according to their probabilities.確率の低い受信者はリストから除外してもよい。 Low probability recipient may be excluded from the list.

これにより、メッセージの受信者を入力する際に、その入力の正しさをチェックできる。 Thus, when entering the recipient of the message, it checks the correctness of the input.テキスト解析により、メッセージが実際に、指示された受信者宛である確率を算出できる。 The text analysis, the message actually can calculate the probability is addressed instruction recipient.他方、ユーザにより指示された受信者を、識別された受信者と比較してもよい。 On the other hand, the recipient designated by the user, may be compared with the identified recipients.これにより、正しい受信者が指示された確率を算出することもできる。 Accordingly, it is possible to calculate the probability that the correct recipient has been instructed.いずれの場合でも、確率が低すぎる場合には、適当な方法でユーザに通知し、あるいは受信者をより確率の高い受信者と入れ替えることができる。 In any case, if the probability is too low, it can be replaced with appropriate to notify the user in a manner, or recipient more probable recipient.

別の実施例として、識別された受信者を、受信者の連絡先データの自動補完のために用いることも可能である。 As another example, the identified recipient, can be used for auto-completion of the contact data of the recipient.ユーザがメッセージを書き終えて連絡先データを入力した後、そのメッセージの最も確率の高い受信者であって、ユーザにより指示された文字の組合せで始まるような受信者を提示することができる。 After the user enters the contact data finished writing the message, it can be a most probable recipient of the message, and presents the recipient as beginning with the combination of the character designated by the user.これにより、自動補完による受信者入力により誤った受信者へメッセージを送信することが効率的に回避できる。 Thus, sending a message to the wrong recipient by the recipient input by autocomplete can effectively avoided.

本発明の別の実施形態として、ユーザがメッセージを書き終えた後、すべての受信者候補を含む受信者グループをユーザに提示することができる。 Another embodiment of the present invention, after the user has finished writing the message, the recipient group containing all potential recipients can be presented to the user.

ユーザは、テキストから抽出された特徴が受信者の特徴と一致しなければならない程度を示す閾値を設定できる。 The user can set a threshold value indicating the extent to which features extracted from the text must match the characteristics of the recipient.この閾値よりも高い一致に達したすべての受信者を、受信者グループの候補メンバーとして表示することができる。 All recipients reached higher matching than this threshold, it can be displayed as a candidate member of the group of recipients.これにより、ユーザが当初忘れていた受信者を受信者グループに含めることが可能である。 As a result, it is possible to include the recipient that the user had forgotten the original to the recipient group.

本発明のその他の実施形態として、システムは、同じ話題についてのメッセージを一貫して受け取るユーザをモニタするだけで一組の個人を事実上のトピックグループであると結論することができる。 Other embodiments of the present invention, the system simply by monitoring user to receive messages for the same topic consistently can be concluded that topic group of virtually a set of individuals.この情報は、ユーザあるいは他のアプリケーションに対して利用可能とされ、たとえばより好ましくはワーキンググループに関する情報を用いるユーザアプリケーションに対して必要とされるような方法で採用することができる。 This information is available to the user or other application, for example, and more preferably can be employed in such a way is needed for the user application using the information about the working group.

別の実施例として、本発明による方法は、多数のメッセージを管理しなければならないインターネットフォーラム等の環境において適用可能である。 As another example, the method according to the present invention is applicable in the environment of Internet forums that must manage many messages.サーバに入って来るメッセージを、その内容に関して解析することができる。 The message coming into the server, can be analyzed in terms of its content.解析の結果に基づいて、類似のメッセージを読み出すことが多い受信者を識別できる。 Based on the results of the analysis, to identify the recipient often read similar messages.これにより、これらのメッセージは、これらのユーザにとって興味のあるものとしてマークできる。 Thus, these messages can be marked as being of interest to these users.好ましい内容に関する知識を連続的に更新することも可能である。 It is also possible to update the knowledge of the preferred contents continuously.

すべての実施例において、識別された受信者から個々の識別子を意図的に削除する可能性をユーザに提供できる。 In all embodiments, it is possible to provide the possibility of intentionally remove individual identifier from the identified recipient user.インターネットフォーラム等の環境では、識別された受信者から固有の受信者識別子を削除することができる。 In environments such as the Internet forum, it is possible to delete a unique recipient identifier from the identified recipient.このような削除により、解析および／または分類を実行するための知識を同時に更新することができる。 Such deletion can simultaneously update knowledge to perform the analysis and / or classification.

本発明を有利な態様で実施し改良するためのいくつかの選択肢がある。 There are several options for improving embodying the present invention in an advantageous manner.これに関しては、一方で請求項１に従属する請求項を参照し、他方で本発明の方法の好ましい実施例に関する以下の説明を図面とともに参照されたい。 In this regard, on the one hand with reference to the claims subordinate to claim 1, and to the following description of the preferred embodiment of the method of the present invention together with the figure on the other hand.

好ましい実施例および図面の説明においては、一般的に本発明の好ましい実施形態および改良形態も説明される。 In the description of the preferred embodiments and the drawings, preferred embodiments and refinements of generally present invention are also described.

図１は、本発明による方法の実施態様を示す流れ図である。 Figure 1 is a flow diagram illustrating an embodiment of the method according to the invention.個々のプロセスは一般に、特徴の抽出および／または分類を実行するために適用されるアルゴリズムとは独立である。 Each process generally, the algorithm applied to perform the feature extraction and / or classification is independent.まずステップ１で、ユーザがメッセージを作成する。 First, in step 1, the user creates a message.ステップ２でメッセージの内容を解析した後、ステップ３で、解析の結果を分類アルゴリズムに供給する。 After analyzing the contents of the message in step 2, in Step 3, and supplies the result of the analysis to the classification algorithm.最後にステップ４で、ユーザへの提案を生成し、ユーザは、提案された受信者のうちの１受信者を選択し、あるいは、提案に含まれない受信者で置換する。 Finally, in step 4, to produce a suggestion to the user, the user selects one recipient of the proposed recipient, or replaced with not contained in proposed recipient.解析されるメッセージとユーザとの間でこのようにしてとられた相関を用いて、分類に必要な知識を更新する。 Using the thus taken correlation between the message and the user to be analyzed, and updates the knowledge necessary for classification.このため、ステップ５で、知識の更新を開始する。 For this reason, in step 5, to start the update of knowledge.抽出された特徴と選択された受信者との間の関係を確定し、対応する受信者に関して収集された情報と組み合わせる。 To confirm the relationship between the extracted features and the selected recipient, combined with information collected for the corresponding recipient.その後、ステップ６で、次のメッセージを待機する。 Thereafter, in step 6, to wait for the next message.

図２は、ベイジアンクラシファイアから導出可能なナイーブベイジアンクラシファイアについて、本発明による方法を使用する流れ図である。 2, the Bayesian classifier that can be derived from the fire naive Bayesian classifier is a flow diagram using the method according to the invention.ベイジアンクラシファイアは、原理的に、条件付き確率を関連づけるベイズの定理に基づく。 Bayesian classifier is, in principle, based on Bayes' theorem to associate the conditional probability.実施例では、メッセージＭ iが受信者Ｒ j宛である確率を計算することができる。 In an embodiment, it is possible to calculate the probability that the message M i are recipients R j.この確率は、特徴Ｔ a ，Ｔ b ，Ｔ c ，...がメッセージＭ i中に現れるために条件付きとなる。 This probability is characterized T a, T b, T c , ... is conditional to appear in the message M i.したがって、条件付き確率は次式により計算される。 Therefore, the conditional probability is calculated by the following equation.

Ｐ（Ｔ a ，Ｔ b ，Ｔ c ，...｜Ｍ i ⊂Ｒ j ）は、特徴Ｔ a ，Ｔ b ，Ｔ c ，...が受信者Ｒ j宛のメッセージに含まれる確率を計算する。P (T a, T b, T c, ... | M i ⊂R j) , the calculation of the probability that the characteristics T a, T b, T c , ... is included in the message addressed to the recipient R j to.一般に、特徴Ｔ a ，Ｔ b ，Ｔ c ，...の間には依存関係がある。 In general, characteristics T a, T b, T c , ... dependencies between.しかし、ナイーブベイジアンクラシファイアの場合には、個々の特徴がメッセージ中に互いに独立に生起し得ると仮定される。 However, in the case of naive Bayesian classifier, the individual features are assumed to be occurred independently of one another in the message.条件付き確率Ｐ（Ｔ a ，Ｔ b ，Ｔ c ，...｜Ｍ i ⊂Ｒ j ）は、個々の特徴に対する条件付き確率の積で置き換えることができる。 Conditional probability P (T a, T b, T c, ... | M i ⊂R j) can be replaced by the product of the conditional probabilities for individual features.上記式中の分母Ｐ（Ｔ a ，Ｔ b ，Ｔ c ，...）は受信者とは独立なので、この部分は、受信者Ｒ jに対するメッセージＭ iの関連性を決定する際には無視できる。 Denominator P in the aforementioned formula (T a, T b, T c, ...) are so independent of the recipient, this part is ignored in determining the relevance of messages M i for the recipient R j it can.したがって、計算しなければならないのは次の項である。 Therefore, it should be calculated is the next section.

各因子は、受信者Ｒ jへのメッセージＭ i中に個々の特徴Ｔ a ，Ｔ b ，Ｔ c ，...が生起する確率である。 Each factor recipient individual features T a in the message M i to R j, T b, T c , ... is the probability of occurrence.

図２（Ａ）は、このナイーブベイジアンクラシファイアを適用する場合の、本発明による方法の実施態様を示している。 2 (A) is, in the case of applying this naive Bayesian classifier, which shows an embodiment of the method according to the invention.ここでは、本方法の適用について、共通するプロセスを流れ図で示している。 Here, the application of the method is shown in flow diagram the common process.まず、ユーザがメッセージを生成する（ステップ７）。 First, a user generates a message (step 7).その後ステップ８で、解析アルゴリズムによりメッセージの特徴を抽出する。 Thereafter Step 8 extracts the feature of the message by the analysis algorithm.特徴Ｔ a ，Ｔ b ，Ｔ c ，...が選択できた場合には、それらの特徴の少なくともいくつかがメッセージ中に含まれている。 If the characteristic T a, T b, T c , ... could be selected, at least some of these features may be included in the message.

その後、個々の特徴の関連性に関して、受信者候補リストに保存されている個々の受信者を解析し、これに基づいて、受信者に対するメッセージの関連性を計算する。 Then, with respect to the relevance of individual features, to analyze individual recipient stored in the recipient candidate list, on this basis, it calculates the relevance of the message to the recipient.まずステップ９で、受信者リストに含まれる受信者でまだチェックしていないものが存在するかどうかをチェックする。 First, in step 9, to check whether or not the recipient that is included in the recipient list has not been checked yet exists.存在する場合、ステップ１０においてその未チェック受信者から特徴の関連性に対するデータを取得し、ステップ１１でそれをナイーブベイジアンクラシファイア（分類部）に供給する。 When present, it acquires data for relevance features from the unchecked recipients at step 10, and supplies it to the naive Bayesian classifier (classifying section) in step 11.この後、ステップ９の処理に続く。 Thereafter, subsequent to the processing of step 9.受信者リストの全受信者を処理したらループを抜け、ステップ１２で、ユーザへの提案を生成する。 It exits the After processing all recipients recipient list loop, in step 12, generates a proposal to the user.この提案は、解析および分類に従って、受信者とみなすべき１または複数の受信者候補を示す。 This proposal, according to the analysis and classification, indicating one or more potential recipients to be regarded as a recipient.

最後に、すべての計算されたデータを用いて知識を拡充し、特徴と、相関づけられた受信者との組合せを既存の知識と組み合わせる（ステップ１３）。 Finally, expanded knowledge using all of the calculated data, combining the features, and combining existing knowledge of the recipients correlated (step 13).その後、次のメッセージを処理することができる（ステップ１４）。 Then, it is possible to process the next message (step 14).

図２（Ｂ）は、学習手続きを実行するための流れ図を示している。 FIG. 2 (B) shows a flow diagram for performing a learning procedure.この手続きは、最初の知識の構築と、知識の更新のために適用可能である。 This procedure, and the construction of the first of knowledge, it is possible to apply for the renewal of knowledge.ステップ１５でメッセージを受け取る。 Receiving a message at step 15.ステップ１６で、受信者リストがそのメッセージの受信者を既に含んでいてその受信者が既知であるかどうかをチェックする。 In step 16, the recipient list is a recipient of the message have already contains checks whether the recipient is known.受信者が未知である場合、新たなエントリを生成する（ステップ１７）。 If the recipient is unknown, it generates a new entry (step 17).その後、いずれの場合でも（受信者が既知でも未知でも）、受信者へ送信されるメッセージに対するカウンタを増加させる（ステップ１８）。 Then, in either case (recipient even unknown even known), increase the counter for the messages sent to the recipient (step 18).次に、メッセージに含まれる個々の特徴を処理し、受信者に関連性があるとして分類する。 Next, processes each of the features contained in the message is classified as being relevant to the recipient.このために、まずステップ１９で、まだ未処理の特徴が存在するかどうかをチェックする。 For this, first, in step 19, it checks whether there are features of the still untreated.存在する場合、ステップ２０で未処理の特徴を受信者に追加してから、処理はステップ１９に続く。 When present, add features unprocessed recipient at step 20, processing continues at step 19.このようにしてすべての特徴を処理した後、ループを抜ける。 After processing all of the features in this way, it leaves the loop.そして、プログラムフローは終了し、次のメッセージを処理することができる（ステップ２１）。 Then, the program flow can be completed to process the next message (step 21).

一例として、ユーザが次のようなメッセージをタイプ入力したものとする："Dear John, I am attaching the requested reports for our quality control test next Monday. I'll meet you directly at the testing facilities. Best regards, Andrew" （ジョン、次の月曜に品質制御テストの要求されたレポートを添付するつもり。実験棟で直接会いましょう。アンドリューより）。 As an example, the user is assumed that typing a message similar to the following:.. "Dear John, I am attaching the requested reports for our quality control test next Monday I'll meet you directly at the testing facilities Best regards, Andrew "(John, going to attach the requested report of the quality control test to the next Monday. see you directly in the laboratory building. than Andrew).この場合、テキスト解析は、"John"（ジョン）, "quality"（品質）, "control"（制御） および "meet"（会う）という単語を検索し、（分類処理を通して）想定しうる受信者として「John@foo.com」を提案する。 In this case, text analysis, "John" (John), "quality" (quality), "control" (control) and "meet" (meet) to search for the word, recipients can be assumed (through the classification process) to propose a "John@foo.com" as.ユーザ（Andrew）はジョン(John)と品質制御問題についていつも議論しているからである。 User (Andrew) is because always discusses the quality control problems with John (John).同様に、メッセージの形式、"meet"（会う）という単語および平日である"Monday"（月曜）という記述から、アンドリューの上司あるいは彼の秘書を受信者候補として提案することができる。 Similarly, the format of the message, "meet" from the description of (meeting) is the word and the weekday that "Monday" (Monday), it is possible to propose the Andrew's boss or his secretary as the recipient candidate.

図３は本発明による方法の実施態様を実現する情報処理装置のブロック図である。 Figure 3 is a block diagram of an information processing apparatus for realizing the embodiment of the process according to the invention.情報処理装置にはメッセージングツール１０１が設けられ、メッセージングツール１０１はメッセージテキストを入力部１０２を通して供給し、入力部１０２によってユーザはメッセージの入力、可能な受信者の選択あるいは置き換えなどを行うことができる。 The information processing apparatus messaging tool 101 is provided, the messaging tool 101 supplies the message text through the input unit 102, the input unit 102 the user can perform input of the message, the recipient can select or replace such .情報処理装置が受信者を予見するだけでなくユーザ入力に基づいて訂正あるいは示唆することも期待されているならば、メッセージングツール１０１は、ユーザによって送信される仮の受信者リストを提供してもよい。 If the information processing apparatus is also expected to correct or suggested that based on user input as well as predict recipient messaging tool 101 also provide a list of recipients provisional sent by user good.入力されたメッセージはテキスト解析部１０３へ転送され、テキスト解析部１０３は選択された受信者に関するメッセージ特徴の出願頻度を頻度テーブル１０４に格納する。 Input message is transferred to the text analyzer 103, and stores the application message frequency characteristic about the recipients of the text analysis unit 103 is selected in the frequency table 104.分類は、分類部１０５により実行され、受信者候補リストが生成され、結果通知部１０６を通してメッセージツール１０１へ戻される。 Classification is performed by the classification unit 105, the recipient candidate list is generated and returned through the result notifying unit 106 to the messaging tool 101.ユーザが受信者候補を選択あるいは置き換えることによって、頻度テーブル１０４は更新される。 By replaces selection or the recipient candidate users, frequency table 104 is updated.なお、ベイジアンクラシファイア以外のメカニズムを使用する場合には、メッセージシーケンスが異なりうるし、ブロックのいくつかは実装が異なり、除去され、或いは新たなブロックが追加されるであろう。 In the case of using a mechanism other than Bayesian classifier is to be different message sequence differs several implementations of the blocks, is removed, or will the new block is added.

最後に、留意すべき特に重要な点であるが、上記実施例は全く任意に選択されたものであり、本発明による教示の実例としての役割を果たすに過ぎず、本発明を上記実施例に限定するものでは全くない。 Finally, although particularly important point to note, the examples has been totally arbitrarily selected, only serve as illustration of the teaching according to the present invention, the present invention in the above examples not at all intended to be limiting.

本発明による方法の実施態様を示すフローチャートである。 Is a flowchart illustrating an embodiment of the method according to the invention.ナイーブベイジアンクラシファイアについて、（Ａ）は本発明による方法の実施態様の適用例を示すフローチャート、（Ｂ）はその学習を示すフローチャートである。 For naive Bayesian classifier is a flowchart showing a flow chart, a (B) is the learning showing an application example of embodiment of the process according to (A) the present invention.本発明による方法の実施態様を実現する情報処理装置のブロック図である。 It is a block diagram of an information processing apparatus for realizing the embodiment of the process according to the invention.

Claims (20)

Translated from Japanese

メッセージの受信者候補を識別する方法において、前記メッセージは基本的にテキストメッセージを含み、また、前記メッセージは電子的形態であり、 A method for identifying a potential recipients of a message, the message is basically includes a text message and the message is an electronic form,前記メッセージの内容をテキスト解析し、該テキスト解析の結果に基づいて、受信者リストから受信者候補または受信者候補グループを識別することを特徴とする、メッセージの受信者候補を識別する方法。 The contents of the message text analysis, based on the result of the text analysis, characterized by identifying potential recipients or recipient candidate group from the recipient list, the method for identifying a potential recipients of the message.

前記メッセージの個々の特徴が前記テキスト解析により抽出されることを特徴とする請求項１に記載の方法。 The method according to claim 1, characterized in that the individual features of the message is extracted by the text analysis.

抽出した特徴が前記受信者リストの受信者の特徴と比較され、分類が実行されることを特徴とする請求項１または２に記載の方法。 The method according to claim 1 or 2 extracted features are compared with features of the recipient of the recipient list, wherein the classification is performed.

特徴の抽出および／または分類のために、ニューラルネットワーク、サポートベクターマシン、ＭＦＵ（最大使用頻度）アルゴリズム、またはベイジアンクラシファイアのような機械学習アルゴリズムが使用されることを特徴とする請求項１〜３のいずれか１項に記載の方法。 For extraction and / or classification of features, neural networks, support vector machines, MFU (maximum frequency of use) algorithm or machine learning algorithms such as Bayesian classifier is of claims 1 to 3, characterized in that it is used, the method according to any one.

前記ベイジアンクラシファイアがナイーブベイジアンクラシファイアに簡略化されることを特徴とする請求項４に記載の方法。 The method of claim 4, wherein the Bayesian classifier is simplified to naive Bayesian classifier.

１または複数の最も確率の高い受信者および／または１または複数の最も確率の低い受信者（複数可）が識別されることを特徴とする請求項１〜５のいずれか１項に記載の方法。 The method according to any one of claims 1 to 5, 1 or more most probable recipient and / or one or more most probable low recipient (s), characterized in that it is identified .

前記解析および／または分類のために、以前に計算し検証したメッセージと受信者との相関からの知識が使用されることを特徴とする請求項１〜６のいずれか１項に記載の方法。 For the analysis and / or classification method according to any one of claims 1 to 6, knowledge of the correlation between the previously calculated verification message and recipient, characterized in that it is used.

前記知識が学習手続きによって構築されることを特徴とする請求項７に記載の方法。 The method of claim 7, wherein the knowledge is built by learning procedures.

前記知識が、メッセージの受信者の選択および／または入力および／または削除によって生成および／または更新されることを特徴とする請求項７または８に記載の方法。 The knowledge, method according to claim 7 or 8, characterized in that it is produced and / or updated by the recipient's selection of and / or input and / or delete the message.

新しい知識が、古い知識よりも高く重み付けされることにより、受信者候補の識別に対する影響がより高くなることを特徴とする請求項７〜９のいずれか１項に記載の方法。 The new knowledge, by being weighted higher than the old knowledge, the method according to any one of claims 7-9 influence on the identification of potential recipients, characterized in that the higher.

前記受信者に関するさらに詳細なデータおよび／またはユーザによって設定されたプレファレンスが、受信者候補を識別するために使用されることを特徴とする請求項１〜１０のいずれか１項に記載の方法。 The method according to any one of claims 1 to 10, preferences set by the more detailed data and / or user related to the recipient, characterized in that it is used to identify potential recipients .

前記さらに詳細なデータが、前記受信者リスト内の受信者に関する情報を含むことを特徴とする請求項１１に記載の方法。 The method of claim 11 wherein the more detailed data, which comprises information about the recipient of the recipient list.

前記識別された受信者がユーザへの提案として示されることを特徴とする請求項１〜１２のいずれか１項に記載の方法。 The method according to any one of claims 1 to 12, wherein the identified recipient is shown as a suggestion to the user.

前記識別された受信者の提案が、識別された確率に従ってソートされて示されることを特徴とする請求項１３に記載の方法。 The method of claim 13, proposals of the identified recipient, characterized in that it is shown to be sorted according to the identified probability.

前記識別された受信者が、受信者の連絡先データの自動補完のために使用されることを特徴とする請求項１〜１４のいずれか１項に記載の方法。 The method according to any one of claims 1 to 14, wherein the identified recipient, characterized in that it is used for the auto-completion of the contact data of the recipient.

前記識別された受信者に基づいて、受信者グループが生成されることを特徴とする請求項１〜１５のいずれか１項に記載の方法。 The identified based on the recipient was A method according to any one of claims 1 to 15, characterized in that the recipient group is generated.

前記受信者のグループは、グループ関連ツールでの使用のためにユーザ或いは他のアプリケーションで共有されることを特徴とする請求項１６に記載の方法。 Group of the recipient The method of claim 16, wherein the shared user or other applications for use in the group related tools.

ユーザによって示された受信者が前記識別された受信者と比較されることを特徴とする請求項１〜１７のいずれか１項に記載の方法。 The method according to any one of claims 1 to 17 recipients indicated by the user, characterized in that it is compared to the identified recipients.

前記ユーザによって示された受信者が識別された確率に従って訂正され、または、前記ユーザに対して適切な形で誤りが指摘されることを特徴とする請求項１８に記載の方法。 The recipient indicated by the user is corrected according to the probability identified, or method of claim 18, characterized in that an error is indicated in a suitable form to the user.

受信者リストからメッセージの受信者候補を識別する装置において、 In apparatus for identifying potential recipients of the message from the recipient list,前記メッセージの内容をテキスト解析する解析手段と、 Analyzing means for text analyzes the contents of the message,該テキスト解析の結果に基づいて、前記受信者リストから受信者候補または受信者候補グループを識別する分類手段と、 Based on the results of the text analysis, classification means for identifying a potential recipients or recipient candidate group from the list of recipients,を有することを特徴とする、メッセージの受信者候補を識別する装置。 Characterized in that it has a device for identifying the potential recipients of the message.