هندبوک داده باز (بنیاد داده باز)

  • ۱۱ بهمن ۱۳۹۳
  • 4
  • بدون دیدگاه
  • نویسنده: مهدی ثنائی
  • لینک کوتاه:

بنیاد دانش باز (Open Knowledge Foundation) سندی را منتشر کرده است و در آن مباحثی عمومی پیرامون داده باز، همچون چیستی داده باز و چرایی آن، انواع داده باز، مباحث فنی حول آن مورد بحث قرار گرفته است. این سند، […]

هندبوک داده باز (بنیاد داده باز)

بنیاد دانش باز (Open Knowledge Foundation) سندی را منتشر کرده است و در آن مباحثی عمومی پیرامون داده باز، همچون چیستی داده باز و چرایی آن، انواع داده باز، مباحث فنی حول آن مورد بحث قرار گرفته است. این سند، مطالبی مختصر و مفید را تنظیم کرده است و این منظر حائز اهمیت مضاعف است.


می‌توانید این سند را از این لینک دانلود نمایید:

The Open Data Handbook (Open Knowledge Foundation)

در ادامه، مباحثی اولیه برگرفته از این جزوه ذکر می‌گردد:

1. تعریف داده باز

«داده باز» (Open Data) یعنی هر محتوا، اطلاعات یا داده‌ای که مردم بتوانند از آن مجانی استفاده کرده و توزیع نمایند، بدون آنکه با محدودیت‌های قانونی‌، فنی یا اجتماعی روبرو شوند.

ویژگی‌های کلیدی باز بودن عبارت‌اند از:

  • وجود و امکان دسترسی: اطلاعات بایستی در قالب یک کل، نهایتاً با هزینه‌ای معادل هزینه تولید آنها، و ترجیحاً بوسیله دانلود از اینترنت قابل دسترسی باشد. اطلاعات همچنین بایستی در قالب‌هایی مناسب و قابل تغییر در اختیار قرار گیرند.
  • استفاده و توزیع مجدد: اطلاعات بایستی با شرایطی ارائه گردد که امکان استفاده و توزیع مجدد از آنها وجود داشته، بتوان آنها را با اطلاعات سایر پایگاه‌های داده ترکیب نمود. این اطلاعات بایستی در قالب‌های «ماشین‌خوان» (machine-readable) ارائه گردد.
  • مشارکت عمومی: هر فردی بایستی بتواند از اطلاعات بهره برده، آنها را مورد بازتوزیع قرار داد. در این نبایستی تبعیضی در مسیر تلاش فرد یا گروهی خاص قرار داشته باشد؛ همچون محدودیت‌های «غیرتجاری»، که استفاده‌های تجاری را محدود می‌کند.

2. انواع داده باز

انواع مختلفی از داده باز، با استفاده‌ها و کاربردهای خاص خود وجود دارد:

  • فرهنگی: اطلاعات پیرامون اثرها و محصولات فرهنگی، برای نمونه عناوین و نویسندگان؛
  • علمی: اطلاعاتی که در نتیجه یک پژوهش علمی بدست می‌آید؛
  • مالی: اطلاعاتی همچون اطلاعات حساب‌های دولتی (مخارج و درامدها) و اطلاعات بازارهای مالی (سهام، قیمت‌ها، اوراق، …)؛
  • آمار: اطلاعات تولید شده توسط دفاتر آماری، و نیز شاخص‌های اصلی اقتصادی و اجتماعی؛
  • حمل و نقل: اطلاعاتی همچون جداول زمانی، مسیرها، …؛
  • محیط زیست: اطلاعاتی مرتبط با محیط زیست همچون سطح آلودگی و کیفیت رودخانه‌ها و دریاها؛

3. چرا داده باز؟

چرا داده بایستی باز باشد؟ پاسخ بسیار به نوع داده وابسته است. با این حال دلایل مختلفی وجود دارد، همچون:

  • شفافیت: در یک جامعه مردم‌سالار، شهروندان بایستی بدانند که حکومت آنها چه می‌کند. برای این منظور، آنها بایستی آزادانه به اطلاعات و داده‌های حکومتی دسترسی داشته باشند و اینکه بتوانند آن اطلاعات را در اختیار سایر شهروندان نیز قرار دهند. شفافیت تنها بحث دسترسی نیست، بلکه بحث اشتراک و استفاده مجدد را نیز شامل می‌شود، چرا که فهم این اطلاعات معمولا نیازمند تحلیل و بصری‌سازی خاصی است که امکان به اشتراک‌گذاری مجدد آنها را اقتضا می‌کند.
  • تولید ارزش‌های اجتماعی و تجاری: در عصر دیجیتال، اطلاعات یکی از منابع اساسی فعالیت‌های اجتماعی و تجاری به شمار می‌رود. هر چیزی از پیدا کردن دفتر پست محلی یا ساخت یک موتور جستجو نیازمند دسترسی به اطلاعات است، اطلاعاتی که عمدتاً توسط دولت تولید و نگهداری می‌شود. با باز کردن اطلاعات، دولت‌ها می‌توانند به تولید فعالیت‌های تجاری و خدماتی کمک کند که سبب خلق ارزش‌های اجتماعی و تجاری می‌گردند.
  • مشارکت: بیشتر موارد شهروندان عموماً با حکومت‌های خود بصورت پراکنده متعامل می‌شوند، مثلا برای دوره‌های 4 ساله انتخابات. اما با باز کردن اطلاعات، شهروندان می‌توانند بصورت مستقیم‌تری از جریان امور مطلع گردیده و در فرایند تصمیم‌گیری مشارکت کنند. این مسئله فراتر از شفافیت است: نه تنها آگاهی از آنچه اتفاق می‌افتد، بلکه مشارکت و افزودن بر آن.

4. آزادسازی اطلاعات (از نظر فنی)

داده باز بایستی از نظر فنی نیز (همانند منظر قانونی) باز باشد. داده‌ای از نظر فنی باز و آزاد تصور می‌شود که دارای شرایط زیر باشد:

  • موجود باشد: داده بایستی در قیمتی هم‌ارز هزینه تولید آن، و ترجیحاً بصورت مجانی، از طریق اینترنت قابل دانلود باشد.
  • بصورت داده انباشته (Bulk): داده بایستی بصورت یک مجموعه کامل موجود باشد. برای نمونه چنانچه به سند مشخصی نیاز داشته باشید، بایستی تمام مجموعه اسناد مرتبط در یک فایل قابل دانلود نیز قابل دستیابی باشد. یک سرویس Web API یا سرویس‌های مشابه در این زمینه هر چند بسیار مفید هستند، با این نباید جایگزین داده انباشته گردد.
  • در یک قالب باز و ماشین‌خوان: استفاده مجدد از اطلاعات توسط عموم نبایستی توسط محدودیت‌های پتنت محافظت گردد. اما مهم‌تر از آن، آن است که اطلاعات در قالب‌های ماشین‌خوان ارائه گردد که سطوح بالاتری از استفاده مجدد امکان‌پذیر باشد. برای فهم این مسئله، آماری را تصور کنید که در قالب PDF ارائه شده است. این اطلاعات می‌تواند توسط انسان مورد فهم و استفاده قرار گیرد، اما نرم‌افزارها نمی‌توانند بسادگی و بطور مستقیم از این اطلاعات بهره ببرند. لذا چنین اطلاعاتی باید در قالب‌هایی همچون XLS یا CSV ارائه گردد.