わたし、IMIちゃん。イミちゃんって呼んで!
天下統一のためにがんばっているわたし。
天下統一っていっても、もちろんキングダムじゃないわよ。
データについての統一基準をつくろうってワケ。
これまで国も自治体も会社も学者もヒマ人も、みんな自分流の基準でデータを作ってきたわ。
で、せっかく作ったデータ、使い捨てるんじゃなくて、再利用したり、オープンデータとして公開しようって、いろんな人が思うようになってきたの。
でも、みんなが好き勝手に作ってきたもんだから、使い勝手がすっごく悪いのよ。
たとえば「氏名」のデータ。ある人はこんな風につくってる。
でも、こんな風につくる人もいる。
こんな風につくる人もいる。
まあ人間が判断するには問題ないのよ。脳が「全部おんなじ人」ってテキトーに解釈するから。昭和おじさんはテキトーが大得意なんだ!
でも、令和の時代、機械のおともだちが働くようになって困ることになった。機械はテキトーが苦手でうまいこと判断できないのよ。
こういうのを賢いAIに判断させようって研究も進んでるんだけど、そもそも最初からみんなが同じ形式でデータを作ってたらメチャ楽なわけ。わかる?
だからわたし、立ち上がったの。みんなのハッピーのために!
みんな同じルールでデータをつくろうね、って訴え続けてるの。
それが「共通語彙基盤」の考え方なんだよ。
・・・でも、みんなぜんぜんついてきてくれないの(涙)
みんな、わたしの掲げる「理念」には共感してくれるって言うの。
すごいね、がんばってね、って言ってくれるの。
でも、言ってることはわかるけど、あなたのやり方にはとてもついていけないって・・・。
それでわたし、思い切って聞いてみたの。
わたしのどこがいけなかったのかなって・・・
そしたらね、まずこう言われたの。
「お前の作ったルールは分かりにくすぎる。」
「お前の言うとおりのデータなんて誰も作れんわ。」
「政府の推奨データセットってのの説明書に作り方が書いてあるが、それ見てデータを作れるやつはお前以外におらんわ」
って・・・
たとえば、その説明書の「AED設置場所---利用可能曜日」の項目。
そこにはこうやって作りなさいって書いてあるわ。
こんなの簡単よね? 誰でも分かるよね??
設備型クラスの設備プロパティが持つ、本来、期間スケジュール型を継承しているが今回のみ特別に定期スケジュール型に置き換えた利用可能時間プロパティが持つ種別プロパティに"週間"と記載した上で利用可能時間プロパティが持つ開催期日プロパティに当てはめてデータを作るだけよ。月火水木金って。
そしたらね、お前は庶民の気持ちが全然わかってない。お前みたいな上級国民には俺らの気持ちなんて一生わかるもんか、って言われちゃったの。グスン。。。
こんなふうに言われたこともあるわ。
「おまえのデータは俺様のデータベースに入れられないじゃないか」
わたし、もちろん反論したわ。
「グラフ型データベース、トリプルストアってのがあってねそれを使うの。」
「SPARQLを使えば、ふつうのSQLよりも高度な検索ができるの。」
「ティムもお勧めしてるの。とにかくすごいのよ。」
そしたらね、お前は庶民の生活を全くわかってない。俺らみたいな平民はみんなリレーショナルデータベースだ。早くて安くて旨い牛丼が大好きなんだ。お前はマリーアントワネットか。って言われちゃったの。ひどい言い草よね。グスン。。。
他の人にはこうも言われたわ。
「おまえのデータを召喚する呪文は難しすぎる」
あ、召喚する呪文ってのは、APIエンドポイントにリクエストするSPARQLクエリのこと。
たとえば、共通語彙基盤の形式で作られたこんなデータがあるとするね。
これを呼び出すにはこんなふうに書くの。ね、かんたんでしょ!
でもね、そいつ曰く、もしこんなデータだったら、
たったこれだけでいいのにって。
複雑な呪文を考えるのもめんどくさいし、階層構造があるとデータベースを何度もぐるぐる回さないといけないから魔法の効果発動も遅延しちゃうんだって。
ほんで、ウィキデータとかDBペディアみたいなフラットな構造なら速くて旨くてハッピーって言いやがるの。
ほんと下民の考えることって目先の欲のことばかり。
こういうのを「燕雀いずくんぞ鴻鵠の志を知らんや」っていうのかしら。いやになっちゃうわ・・・
共通語彙基盤の本質って、あなたはなんだと思う?
わたしはこう思うわ。
「世の中のあらゆる物事を、適切に分類した上で、適切な名前をあてはめること」と。
たとえば私の「氏名」。共通語彙基盤では [概念型]>[事物型]>[実体型]>[人型] というクラスに分類されて、その人型クラスの持つ [氏名] プロパティに内包される [姓名] というプロパティ名が与えられているの。
わたしの氏名、わたしの好きなケーキの名前、わたしの好きなアイドルグループの名称、それらを「別のもの」としてきちんと分類して、適切な箱に入れて、正しいラベルをつけようね、ってこと。
それは、機械のおともだちへの愛であって、そして人間の幸せにもつながっているの。
わたしはみんなが幸せになる世界をつくりたいと、本気で思っているの。
でも、みんなはついてきてくれなかった。
「語彙基盤の固きに魚の住みかねて元の濁りの田沼恋しき」とか言っちゃってさ。
わたしね、厳しく改革するつもりはなかったの。
わたしのやり方を押し付けるつもりもないの。
データは時代によって形をかえるもの。
柔らかく共通語彙基盤を使ってもらってほしいって思っているの。
だから考えたよわたし。
一生懸命考えた。
みんなが幸せになれる共通語彙基盤の新しいカタチ。
やわらかく、わかりやすく、作りやすく、使いやすい、新しい共通語彙基盤。
それがこの、共通語彙基盤Lite
届け、わたしのねがい...