前説 
 将来、私達の生活はまったく違ったものに変わってしまうだろう。
 それはコンピュータの高機能化と低価格化によって共有しあう知識が肥大化したことと、
 その知識を扱い私達が理解しやすい状態まで整理するこが出来るようになっためである。 

 それは、知りたいと思ったことの情報がすぐに手に入り理解することができる世界である。 

 本論文は漠然とした欲求から知識を獲得するまでのプロセスについて考察する。
 また、実験環境を小説等の物語のデータにおくことにした。格好の実験材料であると考えたからである。
 例えば、以下のような環境を考えてみる。 

  小説を読みたいと考える人がいます。彼らにもっとも適すると思われる本を紹介する。
 この問題を解決するためには、読みたい本がある読者の存在を知り。彼らが何を考えている
  のかを理解し。莫大な文献の中から彼らが望んでいると思われる本を紹介しなくてはならない。
  つまり、漠然とした欲求を具体化するという問題をうちに秘めている分けである。 


  はじめに 
 本論文では検索エンジンの未来の姿を提案する。 
  中でも、本を紹介する検索エンジンのデザインを行う。   
 青空文庫という著作権が切れた本のデーターベースから 
  自分が読みたい本を探すお手伝いをするソフトを作成し 有用性を説明する。 

 提案するソフトは既存の検索エンジンやテキストマイニングのソフトの問題点を 
  補うものである。既存のWeb上の検索エンジンは莫大な文章の中から特定の単語を
  含む文を探す検索方法が取られる。 

 googleなど、優れた検索をもついれば自分の知りたい内容をもつテキスト
  を探すことは容易なことだろう。しかし、特定の単語を含むテキストを検索するこの方法は
  自分が必要とするテキストの内容に習熟している必要がある。欲っしているテキストを特徴
  ずける単語を事前に知っていなくては欲っするテキストをテキストを探すことが出来ないためである。 

 他には自然言語処理をもにテキストデータから知的発見を行う方法がある。
  テキストマイニングと言う手法手ある。文書の特徴を知ることが出来るが未知の分野
  に汎用的に応用できるものでは無いことを断っておく。このことについては別の章にて説明する。 
  
 本論文で提案する検索エンジンはソフトを使う人の欲求を具体化しテキストの提案をおこなうことによって、
  特徴ずける単語を知らなくても。使う人が欲求するテキストを発見する手法をデサインする。 



題1章 コンピュータがテキストについて把握できること 
   私が提案する未来の検索エンジンを理解するために、
   コンピューターがテキストをどこまで理解できるかを説明する。 
  コンピューターが人間の経験や知識を理解するたるには、知識について記述を必要なことを説明する。
   しかし知識などの記述を用いないくも、コンピューターの理解する世界と私達人間が理解する世界と
   の間に対応ずけが出来ることを説明する。 
      
 1-1青空文庫について 
  本には表紙と題と中身と作者と出版社がある。中身には章と文がある。文の中には単語がある。
    そして研究材料としているのはこれらの本が4000冊集めたものである。 


 1-2 人の理解とコンピュータの理解 
  コンピューターが獲得できる知識について 

  私達がほんを読むことができるためには、単語を理解していること、
   単語の集まりから内容をとりだことが出来ること。 
    取り出した内容を理解することが出来なくてはならない。  
  単語の理解するためには、単語が現実世界の何を指しているかを知らなくてはならない。
   文の集まりから内容を取り出すためには、文法を理解していなくてはならない。 
    取り出した内容を理解するためには現実世界の現象にてらしあわさなくてはならない。 
  コンピューターが本から理解できるのは16bitの0と1の集まりだけである文字と。
    16Bitの文字を集めた単語だけである。 
   
  私達は4000冊本からミステリーだとか。古典だとか、サスペンスだとか、
    純文学であるとか分類することが出来る。
   特定の本がどのような内容を本なのかを知っている。
    さまざまな知識や経験に基づいて分類しているわれである。 

  コンピュターは4000冊の本について知ることが出来るのは。本が属性として単語
    をもっていることと、単語が属性と して文をもつということだけである。
    これは単語の意味は文属性の集合によって決まることと、 文の意味は単語によって
    決まるということを意味している。 
  これ以上のことをコンピューターが知るためには人のもつ知識をコンピュータが使える
    形に直してコンピューターに教えなくてはならない。 

  1-2 コンピュータが人の読みたい物語を知る方法 
  ソフトを作る人が人間の経験や知識を記述する方法とコンピュータが理解する世界と
    人間が理解する世界と対応する部分を用いる方法である。 
   人のもつ知識や経験を用いる方法は後述する。 
  
  
  
 本論文の前半では連想検索エンジンについて紹介を行う。 
  また、 知識を提案する。 まず、既存のサービスが  

テレワークならECナビ Yahoo 楽天 LINEがデータ消費ゼロで月額500円〜!
無料ホームページ 無料のクレジットカード 海外格安航空券 海外旅行保険が無料! 海外ホテル