現状

 私の卒論の担当の先生が諸事情により変わることに成りました。 卒論が何になるかわ解りませんが、データーベース関連に落ちつくことに なりそうです。
 しかし、データーベースを卒論にするとなると、どの部分が論になのだろうか? うーん、私はデーターベースを知りません。
 
ところで、今までに頂いたアドバイス
  1.  画像検索 ビットマップの特徴から検索ようのインディクス作り。 例えば、ひげをはやしたひとの画像がほしいとか
  2.  マルチメディアコンテンツの作成  さまざまなメディアを統合したサービス
  3.  ユーザーインターフェイス  こんなのいかがと進める
  4.  
 

辞書とインディックス

 今回は全文検索を導入します。簡単な全文検索ソフトはまず索引を作ります。 作成した索引が全文をサポートしていれば全文検索に成るわけです。
 N−Gramや形態素解析など索引つくりにはさまざまな方法がありますが、今回の焦点は 索引そのものです。 索引をどのような構造にするべきかを考えます?  今後、どうすれば実用的な索引になるかを考えていきます
    取り合えず、ハッシュを使えるようになるまでです。

非効率な辞書

 まずは、私が全文検索用に以前考えもの。  こんな感じ
入子構造になっております。IndexDataはアドレスクラスを作成と抽象化して、 外部や内部のデータにリンクがある索引を保持できるように成ります。

不安

 ↑のような構造だとJAVAのガベージコレクションについての不安があります。
   GCにとって非効率な構造のような気がします。 ( @ITの”第3回 Javaのヒープ・メモリ管理の仕組み”が参考になります。
 そもそも、メモリーに入りきらないほどデーターが増えた場合、 ランダムアクセスが出来る状態でこのデーター構造を圧縮できるのだろうか?

ということで、すこし圧縮に関する勉強をしてみようかと考えております。
ところでDeepFreezerの作者である 参考 の方の本が書店においてありました。


 勢いで購入してしまいました。
 後ほど、紹介させていただきます。
  ”LHAとZIP 圧縮アルゴリズム×プログラミング入門”は良い本です

参考

第3回 Javaのヒープ・メモリ管理の仕組み
データ圧縮の基礎 - やまざき@BinaryTechnology

Gポイントポイ活 Amazon Yahoo 楽天

無料ホームページ 楽天モバイル[UNLIMITが今なら1円] 海外格安航空券 海外旅行保険が無料!