あるデベロッパーコンテストの話
今某携帯会社のAndroid開発コンテストに参加中です。
コードの共有って言うのは みんな1ヶ月前から学び始めた僕よりJavaに精通している人ばかりですが、MySqlをいじったことがない、つまりはデータベース操作に慣れていない人と開発をともにすると
間違いなくデータベース知識がある人にほとんどのコーディングの重みが偏ってきます。
社会人PGならデータベース構造を知らないなんてのは論外ですが、
当たり前ながら学生なので知っている人もまちまちいます。
しかし、今回そのデータベース知識がある人間があまりおらず、私が率先してやる形になりました。
結局私一人のプロジェクトになりかけています(チームリーダ的役割を担ったので仕事配分できない私が悪いのでしょう)
さて、そんなAndroidアプリの内容は
本棚シェアアプリです。
本・DVD・CDをカメラでパシャっとすれば本の情報を持ってきてくれて、自分の専用本棚に
ストアしておくことができます。
さらにツイッターと連携していて、ツイッターID検索をするとその人の本棚を表示してくれます。
なかなか面白そうでしょう。
そのカメラをパシャっとして物体のタイトルを返してくれるAPIがあるのですが
これが結構曲者で 「タイタニック(豪華特典付き)」とかの情報を返してくれるわけです。
そのDVDとかのあらすじをwikipediaから抜き取ってくるんですが、(豪華特典付き)というのが結構邪魔になります。
(豪華特典付き)や(2点おまけ)や(限定版)などなどいろいろあるのです。
多分amazonのタイトルを持ってきているのかもしれません。
いわば無数にあるなか、私がかんがえたのは「はてなキーワード」「wikipediaタイトル」との連携です
mecabにはてなキーワードとwikipediaタイトルの辞書をインプットしておいて、
品詞分解にかけます。タイタニック(豪華特典付き)を例にしますと。
「タイタニック」「(」「豪華」「特典」「付き」「)」の順番で品詞分解されます。
さらに単語だけのオプションを追加して 記号を省きます。
そしてたいていは、第一出力である、例ならば「タイタニック」を抜き出して
wikipediaに検索をかけます。
まあまあ考えた方でしょ?