موضوع ارائه | مباحث فنی شفافیت |
ارائه دهنده | دکتر مهدی ثنائی |
مدت زمان ارائه | 73 دقیقه |
پاورپوینت ارائه | https://tp4.ir/e–q |
متن پیاده شده ارائه | https://tp4.ir/NG6R |
شفافیت از جمله مباحثی است که وابستگی بسیار زیادی به فناوری و رشد تکنولوژی دارد. بهگونهای که مصادیق این مفهوم با تغییرات فناوری دچار تغییر میشوند. به همین دلیل برای فهم دقیق شفافیت نیاز است تا آشنایی اولیهای با فناوریهای روز دنیا داشته باشید. در این ارائه علاوه بر مرور مقوله وبمعنایی و ویژگیهای سه نسل وب، سطوح و قالبهای انتشار داده، رابط برنامهنویسی (API)، داده متصل (linked data)، مصورسازی داده (data visualization) و پورتالهای داده باز مورد بررسی قرار میگیرند. بعد از مشاهده این ارائه میتوانید فناوریهایی که باعث ایجاد شفافیت میشوند را بشناسید و کیفیت انتشار اطلاعات در نهادهای مختلف را مورد نقد و بررسی قرار دهید.
فیلم ارائه
فهرست مطالب
- وب معنایی (وب ۰/۳)
- رابط برنامهنویسی (API)
- قالبهای رایج
- کاربردهای XML
- کیفیت داده
- داده متصل (Linked Data)
مقدمه
همانطور که در جلسات قبل توضیح داده شد شفافیت یا ارائه اطلاعات سبب ایجاد تحلیلهایی میشود که این تحلیلها، بخاطر پیگیری یا مکانیزم خودکنترلی که در شفافیت وجود دارد باعث مطالبه اصلاح رفتار شده و درنهایت این مطالبه، موجب اصلاح رفتار میشود.
بین ارائه اطلاعات و تحلیل اطلاعات بحث بسیار مهمی وجود دارد. فارغ از این که چه اطلاعاتی و آن اطلاعات چگونه ارائه شود، بر اینکه آیا اطلاعات قابل تحلیل هست و چقدر و چگونه میتوان آن را تحلیل کرد، تأثیر دارد.
در تمام دوره مباحث شفافیت، ابعاد حقوقی شفافیت مورد بحث قرار میگیرد که چه اطلاعاتی داده و چه اطلاعاتی داده نشود.
این جلسه به ابعاد فنی بحث شفافیت میپردازد که اطلاعات چگونه باید داده شود؟ بهطور کلی اگر همه محورهای اطلاعات داده شود اما اطلاعات درست نباشد، شفافیت رخ نداده است.
۱ API چیست؟
میتوان گفت که API اولین و مهمترین بحث از مباحث فنی میباشد. در وب، انتقال داده به یک سرور بر عهده API است.
شرکت MuleSoft یک شرکت بزرگ است که سرویسهای API ارائه میدهد.
APIسرویسی ارائه میدهد که از طریق آن، هر کسی میتواند یکسری اطلاعات مشخص را از یک سرور خواسته و سرور آن اطلاعات را به او بدهد.
به عنوان مثال فردی میخواهد قیمت پروازهای مختلف را برای سایت خود به دست آورد. چون دسترسی به تمام سرورهای شرکتهای هواپیمایی را ندارد درنتیجه شرکتهای هواپیمایی سرویسهای API ارائه میکنند که اگر کسی بخواهد از اطلاعات آنها استفاده کند از آن API و قالب و شرایط استفاده کند. بنابراین از طریق فراخوانی API اطلاعات را به دست آورده و در سایت خود نمایش میدهد.
۱-۱٫ مزایای API
قبل از API، اطلاعات داده در وب به صورت فایل معمولی بود. در اینجا ارائه اطلاعات به صورت فایل با ارائه اطلاعات از طریق API مورد مقایسه قرار میگیرد:
- هزینه اطلاعاتی که روی وب قرار میگیرد برای منشرکننده از طریق API بیشتر است اما به صورت فایل معمولی کمتر است.
- API نیاز به پشتیبانی بیشتری نسبت به فایل معمولی دارد.
- ترکیب ماشینی اطلاعات با دیگر دادهها از طریق API ساده است اما در فایل معمولی دشوار است.
- استفاده از API در پلتفرمهای مختلف ساده اما در فایل معمولی دشوار است.
- عمر داده در API در لحظه (زنده) است اما در فایل معمولی دارای تأخیر (مرده) میباشد.
۱-۲٫ مثال تفاوت اطلاعات به صورت وب معمولی با API
تصویر سمت چپ یک صفحه وب معمولی و سمت راست API همان صفحه را نشان میدهد که به صورت داده ارائه شده است.
۱-۳٫ سایت Programmableweb
هر کسی که API را ارائه میکند آن را در این سایت معرفی کرده تا دیگران بدانند چنین دیتایی وجود دارد و از آن استفاده کنند. درواقع یک سایت مرجع میباشد. مثل همه شرکتهای مطرح، دانشگاهها، کتابخانهها و …
mash ups سرویسهایی هستند که دو یا چند API با هم ترکیب شده و API جدیدی ایجاد میشود.
تنها سایت ایرانی که اطلاعات را به صورت API ارائه میدهد سایت khamenei.ir است که میتوان اطلاعات مربوط به آن را به صورت API دریافت کرد. در پایین صفحات این سایت، بخشی به نام API وجود دارد که در آن نوع خروجی، نوع پارامتر، نحوه دادن اطلاعات و … توضیح داده شده است.
۲ وب معنایی (وب ۰/۳)
در وب ۰/۱ یک نفر تولیدکننده محتوا و یک نفر مصرفکننده است.
در وب ۰/۲ تولیدکننده و مصرفکننده با هم یکی میشوند.
در وب ۰/۳ یا وب معنایی مشارکت ماشین در تولید محتوا بسیار بالا رفته و میتواند هم محتوا را بخواند و هم ارتباطات را کشف و مبتنی بر آن کشف و ارتباطات، اطلاعاتی را ارائه دهد.
نکته مهم در وب ۰/۳ این است که موتور جستجو یا ماشین چطور باید بفهمد که متنی که در روبروی او قرار دارد چه نوع متنی است.
۳ قالبهای رایج مناسب انتقال داده
بحث اصلی درباره قالبی است که اطلاعات از طریق آنها منتقل میشود. قالبهای جدید بخصوص در XML اطلاعات را از نظر معنا overload میکنند یعنی معانی را به اطلاعات میدهند.
۳-۱٫ XML
زبان نشانهگذاری شده و توسعهپذیر که برای ارائه اطلاعات دربارهی یک سند، از برچسبها (تگ) استفاده میکند.
ارائه اطلاعات از داده به خواننده و توصیف اسناد و دادهها توسط برچسبهای XML صورت میگیرد. در صورتی که برای نمایش اطلاعات در مرورگر از برچسبهای HTML استفاده میشود.
استفاده از XML برای خوانش اطلاعات بسیار راحت، غیرمبهم، توسعهپذیر، مستقل از پلتفرم و بسیار مفید برای انتقال داده از یک مکان به مکان دیگر در سرتاسر اینترنت است.
۳-۱-۱٫ مزایای XML
- داده را قابل حمل میکند
- قابل خوانش توسط انسان نیز میباشد
- بسیار رسا است چون معانی در کنار دادهها قرار دارد
- انعطافپذیر و قابل سفارشیسازی (برچسبها قابل توسعه)
- قابل استفاده برای برنامهها
- تبدیل ساده با سایر قالبها
- استانداردها و ابزارهای افزودهی متعدد
- استفاده و پشتیبانی گسترده
۳-۲٫ مقایسه JSON با CSV
قالب JSON در API که فراخوانی میشود متداول است و خروجی از جنس JSON میدهد. اما در قالب CSV دادهها با کاما از هم جدا و داخل یک ستون نمایش داده میشود.
۳-۳٫ مقایسه JSON با XML
نوع قالب در هر دو با هم تفاوت دارد.
۳-۴٫ نمونهای از کاربردهای XML
۳-۴-۱٫ آکوما انتوسو (Akoma Ntoso)
متن زیر بخشی از یک قانون، ماده و تبصره را نشان میدهد. افراد با دیدن آن متوجه موضوع میشوند اما ماشین از آن فقط رشته ای از کاراکترها را میفهمد. بنابراین متن باید به طریقی برای ماشین قابل خوانش شود. راحتترین روش این است که معانی با اطلاعات همراه شوند.
سؤال اول:
این متن قانون چقدر توسط سیستم قابل فهم است؟
سؤال دوم:
چطور این فهم قابل توسعه است؟
برای این موضوع استانداردی به اسم آکوما انتوسو (Akoma Ntoso) را توسعه دادهاند. با استفاده از قالب XML، استاندارد جدیدی را ساختهاند که بتواند اسناد پارلمانی، قانونگذاری، تقنینی و قضایی بین نهادها را پوشش دهد.
۳-۴-۱-۱٫ اهداف راهبردی:
- ایجاد «زبان واحد» برای تبادل اسناد پارلمانی، تقنینی و قضایی بین نهادها
- ذخیرهسازی و دسترسی طولانیمدت به اسناد پارلمانی، قانونی و قضایی
- ارائه خطمشی قابل اجرا برای سیستمهای پارلمانی، قانونی و قضایی در مؤسسات
- ایجاد الگوهای معمول داده و فراداده
- ایجاد سازوکارهای مشترک برای نامگذاری و مرتبطکردن منابع
- خودتبیین بودن
- توسعهپذیر
پارلمان آمریکا درنظر داشته که آکوما انتوسو را توسعه دهد و متناسب با فرآیندها، ابعاد و نظام قانونی خودش متناسبسازی کند. کتابخانه کنگره ایالات متحده دو مسابقه برای تولید XML مبتنی بر Akoma Ntoso برگزار و برای یکی از آنها ۵ هزار دلار و برای دیگری ۱۰ هزار دلار جایزه درنظر گرفت و اعلام کرد که هرکس بتواند محتوا را توسعه دهد، برنده خواهد بود.
۴ داده متصل (Linked Data)
اطلاعات چگونه به هم متصل میشوند؟
به عنوان مثال فردی از اطلاعات شهرداری استفاده و نرمافزار مسیریاب برای ویلچرداران طراحی کرد. خود شهرداری از ایده استفاده کرد و چیز دیگری ساخت. آن فرد از همین ظرفیت استفاده کرد و یک سایت برای مجموعه خیریه درست کرد. با پولی که بدست آورد دیتاست دیگری ساخت که آن هم با یک دیتاست در دانشگاه ترکیب شد و … به همین ترتیب همه اینها به هم مرتبط میشوند به شرطی که دیتا این قابلیت را داشته باشد.
۵ کیفیت داده
همه دادهها یکجور نبوده و میتوانند قابل استفاده باشند یا نباشند. برای این قابلیت، کیفیت انتشار داده را به پنج سطح دستهبندی کردهاند:
- قالبهای تصویری. صرفاً قابلیت خوانش انسانی میسر است یعنی داده یک ستاره. مانند فایلهای PDF، JPEG، PNG
- قالبهای متنی. ویژگی این قالبها این است که میتوان از اطلاعات آن کپیبرداری و همچنین در آن اطلاعات را جستجو کرد یعنی داده دو ستاره. مانند فایلهای DOC، HTML
- قالبهای مشترک. قابلیت خوانش و پردازش اطلاعات بین انسان و ماشین یعنی داده سه ستاره. مانند فایلهای XL، CSV، XML
- فراخوان ماشینی. قابلیت فراخوانی و پردازش ماشینی یعنی داده چهار ستاره. مانند API (JSON)
- رعایت استانداردهای داده متصل. تکمیل جورچین دادگان در ارتباط با دادههای دیگر یعنی داده پنج ستاره. مانند API + Linked Data
در بیشتر کشورها حداقل سطح انتشار، سه ستاره و در بعضی دیگر ۴ و ۵ ستاره عنوان شده است. در ایران قانون و استانداردی در این زمینه وجود ندارد پس اطلاعاتی که داده میشود ۱ یا ۲ ستاره است و در موارد معدودی ۳ ستاره میباشد.
۶ مصورسازی داده Data Visualization
بهطور خلاصه، مصورسازی داده یعنی اگر یکسری اطلاعات داده شود، در حالت عادی و در بهترین حالت تعدادی جدول پر از عدد هستند که نمیتوان بررسی و تحلیل سریع و عمیقی از آنها داشت.
۶-۱٫ مثال
۶-۱-۱٫ میزان ازدواج و طلاق
در حالت عادی یک فایل اکسل است و همان اطلاعات به صورت CSV به شکلی دیگر است که با کاما از هم جدا شدهاند. با فرمت TSV بهجای کاما، تب دارد و یا در فرمت JSON، اطلاعات با API خوانده میشود. اما با مصورسازی این دادهها در قالب یک نمودار، به سادگی قابل فهم میشوند.
۶-۱-۲٫ توزیع بودجه فرهنگی کشور
یکسری اطلاعات درباره بودجههای فرهنگی کشور را نشان میدهد که در سال چقدر بوده و چگونه توزیع شده است. اگر اطلاعات در قالب یک نمودار حجم نسبی ارائه شود تصورات دقیقتری را در پی خواهد داشت.
۶-۲٫ نمودار ترکیبی
گاهی میتوان نمودارها را با هم ترکیب و تصورات و اداراکهای بهتری را ایجاد کرد. در نمودار زیر، آمار طلاق را با جغرافیا، رنگ و نمودار در کنار هم قرار داده و ادراک بهتری را ایجاد میکند.
۷ پورتال داده باز
آیا مطلوب است که از حاکمیت خواسته شود که در سایتهای خود API قرار دهند؟ خیر. حاکمیتها باید تلاش کنند که تمام دادهها در یک سایت، با یک استاندارد و الگو ارائه کنند.
در نقشه وضعیت پورتالهای داده باز کشورهای مختلف نشان داده شده است. ایران با رنگ قرمز مشخص شده و به این معنی نیست که اطلاعات را بد ارائه میکند بلکه به معنای این است که اصلاً چنین پورتالی را ندارد.
۷-۱٫ چند مثال:
۷-۱-۱٫ پورتال datahub.com
یک نمونه سایت داده است که قالبهای استانداردی مثل CSV را ارائه میکند. در این سایت همه اطلاعات یک قالب استاندارد دارند و هر دیتاست شامل چند داده است. همچنین مشخصاتی مانند سازمان ارائهکننده، منبع و لینک دریافت قابل مشاهده میباشد.
۷-۲٫ پورتال data.gav
پورتال اطلاعات ایالات متحده آمریکا است که تمام دادههای باز برای حکومت ایالات متحده در این پورتال قرار دارد. دادهها در موضوعات و سازمان منتشرکننده قابل دریافت هستند. قالبها استاندارد میباشد. روش فنی مانند API وجود دارد و Linked Data های آن موجود است.
۸ «یو آر آی» (URI) چیست؟
عبارت است از یک رشته کاراکتر برای شناسایی یک نام یا یک منبع بر روی اینترنت.
URI از دو بخش تشکیل شده است:
- URN: مشخصکننده نام منبع
- URL: مشخصکننده روش دسترسی به منبع