オープンデータの下準備に悩む

ここに来て急に、オープンデータで盛り上がっています。ビッグデータやオープンデータという言葉、ここ1年位で一気に業界に広まった感があります。でも広く浸透したとは言い難いのも事実です。自治体におけるオープンデータの取り組みにも、かなりの温度差が見受けられます。にわかのイメージは「ウェブサイト内で公開している様々なデータは、若干の加工でオープンデータ化が可能」らしい?八雲町マップや○○なんかは「ほぼ出来ている」といっても過言ではない?それじゃあ、出来るところからやってみっか・・・。こんな軽いノリで、我社もオープンデータに取り組み事となりました。

システム担当のちゅんから、お願いされた作業が○○の下準備です。○○って何かって?それは、ゴミです。ゴミの分別について、データの整理を頼まれました。我社のウェブサイトに「ゴミの分別辞典」があるので、これをCSVにする作業です。約700種類の物品について、その廃棄方法を説明した物なのですが、品名から悩みます。「缶」なのか「空き缶」なのか?「紙」なのか「新聞紙」なのか?さらに、同じ商品名でも材質や大きさによって出し方が変わる物が多々あります。調理器具の「おたま」は、金属製?プラスチック製?それとも木製?作業は、技術的というよりも整理方法に悩みました。これで良いんダべか?

ウェブサイトのゴミ辞典は、大昔にホームページを作った時代からあります。当時、あまりにもコンテンツが貧弱だったので、たまたま見つけたゴミ分別の手作り小冊子を、せっせと私がhtml化したものがベースになっています。データは全て手打ちしました。よくやったと今更ながら感心です。なので、少し愛着もあったりします。

そんな訳で、半日かけてCSVに直しましたが・・・。今見ても整理がイマイチで、難解な所が多々あります。取り急ぎ「八雲町(八雲地域)のゴミ分別一覧」としてオープンデータが公開されましたが・・・しっくりきていません。何とかせねば!悩む!!

オープンデータ
日本語の「語彙」って難しいですよね?

(投稿者:92)


カテゴリー: つぶやき パーマリンク

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です