حتی اگر تا به حال واژه metadata (ابرداده) را نشنیده باشید، قطعاً با آن آشنا هستید. باید بدانید هر روز بدون اینکه متوجه شوید از آن استفاده می کنید. metadata یکی از آن چیزهای ضروری است که می تواند در یک دید ساده پنهان شود. متا دیتا چیست؟
متا دیتا چیست؟
metadata ممکن است اصطلاحی ترسناک به نظر می رسد، اما اینطور نیست. ابرداده فقط داده هایی است که داده های دیگر را توصیف می کند.
از بسیاری جهات، ابرداده بسیار شبیه گواهینامه رانندگی یا نوع دیگری از شناسه است که با آن آشنا هستید. یک شناسه رسمی معمولاً تاریخ تولد، قد، رنگ چشم، تصویر و سایر اطلاعات مربوط به شما را دارد. ابرداده نقش مشابهی را برای فایل های دیجیتالی موجود در رایانه ها ایفا می کند. metadata معمولاً زمان ایجاد یک فایل یا پوشه، آخرین تغییر آن و سایر ویژگی های مهم آن را توصیف می کند.
انواع مختلف فایل ها اغلب دارای ابرداده های متفاوتی هستند. در اینجا چند نمونه خاص از metadata که ممکن است به فایل های رایج attach شده بیابید، آورده شده است.
نمونه هایی از Metadata
اطلاعات ذخیره شده به عنوان ابرداده به طور قابل توجهی بین انواع فایل متفاوت است. همانطور که ممکن است تصور کنید، تصاویر به metadata متفاوتی از مثلاً یک سند متنی نیاز دارند.
عکس و فیلم
تصور کنید که در یک سفر پیاده روی با استفاده از GPS تلفن خود برای راهنمایی با شما بوده است. هنگامی که در سفر بودید، تلفن خود را بیرون کشیدید و از یک حیوان، قارچ عجیب و غریب یا مناظر منظره عکس گرفتید. به محض گرفتن عکس، اطلاعاتی به آن ضمیمه می شود: تنظیمات دوربین شامل طول نوردهی، ISO، F-stop، سازنده دوربین، زمان گرفتن عکس، و احتمالاً مختصات GPS دوربین هنگام ثبت تصویر است.
هنگامی که این داده ها ذخیره شد، می توان از آن برای مرتب سازی و دسته بندی تصاویر استفاده کرد. برنامه گالری عکس در تلفن شما مثال خوبی است. می توانید تصاویر خود را بر اساس تاریخ و اگر برچسب گذاری جغرافیایی (geotagging) را فعال کرده بودید، حتی موقعیت مکانی مرتب کنید. برنامههای گالری عکس مدرن حتی ممکن است دادههای اضافی را که محتوای یک تصویر را توصیف میکند، مانند «غذا»، «حیوانهای خانگی» یا نام یک شخص خاص، ضمیمه (attach) کنند. این همان چیزی است که به شما امکان می دهد تصاویر را بر اساس محتوای آنها در تلفن خود جستجو کنید. در اینجا نمونه ای از عکسی است که با فعال بودن GPS گوشی گرفته شده است:
فراداده GPS متصل به تصویر فقط به اندازه GPS تلفن همراه شما دقیق است، اما در بیشتر موارد در چند مترهم دقیق است.
فایلهای ویدیویی اطلاعات مشابهی دارند و سپس مقداری اطلاعات اضافی مربوط به نرخ فریم و صدای مرتبط با ویدیو را خواهند داشت.
سمعی
metadata صوتی شامل موارد معمولی است؛ مانند زمانی که فایل ایجاد شده است، اما اطلاعات خاص فایل های صوتی را نیز ذخیره می کند. متادیتا برای فایلهای صوتی معمولاً حاوی اطلاعاتی درباره هنرمند، آلبوم، شماره و نام آهنگ و همچنین اطلاعاتی درباره خود صدا مانند نرخ بیت، عمق بیت و نرخ نمونه است.
Messages
پیامهایی که به افراد دیگر ارسال میکنید نیز دارای ابردادههای مرتبط هستند. نمونههای معمول ابردادههای پیوست شده به پیامها، زمان ارسال، گیرنده و اطلاعات مربوط به هر پیوستی است که پیام ممکن است داشته باشد. برخی از برنامههای پیامرسان ممکن است metadataهای دیگری مانند زمان دریافت و واکنشهای ایموجی را نیز در پیامهای خود جاسازی کنند.
پسوند فایل (File Extensions)
یک نوع خاص از metadata، پسوند فایل است. پسوند فایل مواردی مانند PNG، TXT، DOCX، JPG، MP3 و غیره هستند. پسوند فایل به ویندوز این امکان را می دهد که بداند چه نوع داده ای باید انتظار داشته باشد و چگونه فایل را باز کند. بدون آن، ویندوز نمی تواند به طور خودکار بداند چگونه آن را باز کند و باید به صورت دستی به آن بگویید که فایل را با استفاده از یک برنامه خاص باز کند.
توجه: همه سیستم عامل ها از پسوند فایل برای ذخیره metadata فرمت فایل استفاده نمی کنند.
فایل های کامپیوتری متفرقه
اکثر فایلها دارای ابردادههایی هستند که نسبتاً مختص نوع فایل هستند، با این حال، ابرداده خاصی وجود دارد که اساساً جهانی است. اگر خصوصیات تقریباً هر فایلی را در رایانه شخصی خود بررسی کنید – صرف نظر از نوع فایل – اطلاعاتی در مورد مکان ذخیره فایل، زمان ایجاد، زمان دسترسی به آن، زمان تغییر و زمان ذخیره آن مشاهده خواهید کرد.
چگونه metadata توسط افراد استفاده می شود؟
اگر از یک کامپیوتر یا گوشی مدرن استفاده می کنید، به طور منظم از metadata استفاده می کنید. متادیتا چیزی است که به شما امکان می دهد فایل های خود را بر اساس type مرتب کنید. این چیزی است که به شما امکان می دهد فایل های خود را بر اساس « Date Created»، « Date Modified» یا « Date Accessed» سفارش دهید. اکثر پخشکنندههای رسانه مدرن به شما امکان میدهند موسیقی خود را با نرخ بیت فهرست کنید یا کتابخانه فیلم خود را بر اساس وضوح به دستههایی دستهبندی کنید. وبسایتها اغلب حاوی « meta tags» هستند، نوع خاصی از ابرداده موجود در سربرگ یک وبسایت که برای توصیف محتویات صفحه وب به موتور جستجو استفاده میشود.
هر زمان که فایلها، پوشهها یا وبسایتها را دستهبندی میکنید، به متادیتا متکی هستید.
چگونه دیگر از فراداده استفاده می شود؟
افراد از فراداده به روش های خاصی استفاده می کنند، اما در مورد تصویر بزرگ چطور؟ هر کاری که روی کامپیوتر انجام می دهید داده ها و ابرداده ها را تولید می کند. در نظر بگیرید که امروزه دهها میلیارد رایانه از جمله حدود شش تا هفت میلیارد گوشی هوشمند در حال استفاده هستند. ما مجموعاً هر روز مقدار غیرقابل اندازهای از ابرداده ایجاد میکنیم.
هدف گذاری تبلیغات و محتوا برای افراد خاص
این اطلاعات فقط کنار گذاشته نمی شوند. مقدار زیادی از آن برای تجزیه و تحلیل به الگوریتم های پیچیده و مدل های یادگیری ماشینی وارد می شود. آنچه اتفاق میافتد واقعاً به این بستگی دارد که چه کسی فرادادهها را جمعآوری کرده و چه چیزی میخواهد بیاموزد. میتوان از آن برای تجزیه و تحلیل همه چیز از رفتار یک فرد گرفته تا بزرگترین الگوها و روندهای جامعه استفاده کرد.
بیشترین موارد استفاده از تبلیغات هدفمند و پیشنهادات محتوای شخصی سازی شده است. آیا تا به حال feed رسانه های اجتماعی خود را مملو از تبلیغات مرتبط با چیزی که در تلفن خود جستجو کرده اید پیدا کرده اید؟ آیا روی چیزی غیرمعمول در YouTube کلیک کردهاید تا متوجه شوید که پیشنهادات شما تغییر میکند و نتایج بیشتری مانند چیزی که روی آن کلیک کردید را شامل میشود؟ این الگوریتمی است که کار میکند، بررسی دادهها و ابردادههای مرتبط با شما برای نمایش نتایجی که « thinks» به احتمال زیاد چشم شما را جلب میکند و شما را وادار به کلیک کردن میکند.
استفاده از ابرداده برای افزایش تعامل کاربر، پیامدهای نامطلوبی دارد. مهمتر از همه، تمایل به طرفداری از محتوایی دارد که از نظر احساسی افراطی است: یا باعث میشود احساس خوبی داشته باشید یا واقعاً احساس بدی داشته باشید. هر دو مورد معمولاً تحریککنندهتر از محتوای واقعی هستند. این بخش بزرگی از چیزی است که اسکرول بدون فکر در رسانه های اجتماعی را بسیار اعتیاد آور می کند.
همچنین گاهی اوقات منجر به تبلیغاتی میشود که افراد آن را بسیار تهاجمی میدانند. وقتی در شرایط آبوهوایی احساس میکنید هیچ چیز مانند بررسی WebMD نیست، فقط برای یافتن جدول زمانی فیسبوک خود مملو از تبلیغات برای داروهایی که فهرستی از بیماریها را درمان میکنند که علائم شما را توضیح میدهند.
توجه: فیس بوک قول داده است که برخی از تبلیغات مرتبط با پزشکی را از جمله موارد دیگر محدود کند و قبلاً محدودیت های اضافی را برای تبلیغات دارویی اضافه کرده است.
البته، حتی اگر خط مشیهای رسانههای اجتماعی تغییر کنند و این موارد در فیدهای رسانههای اجتماعی شما نشان داده نشوند، این واقعیت را نفی نمیکند که اطلاعات در آنجا وجود دارد و معمولاً در دسترس بالاترین قیمت پیشنهادی است. بطور معمول، بسیاری از دادههای حساس شما از نظر قانونی محافظت میشوند.
فراداده برای نظارت جمع آوری می شود
علاوه بر تبلیغات و هدف قرار دادن محتوا، کاربردهای زیادی برای ابرداده وجود دارد. از جمله بحث برانگیزترین موارد، نظارت است.
توجه: برخی از برنامههای پیامرسان (مانند Signal) برای به حداقل رساندن مقدار فرادادهای که رمزگذاری نشده است، تلاش میکنند و میگویند که متادیتا را نیز ذخیره نمیکنند.
حتی بدون محتوای واقعی پیامهای شما، اطلاعات بیش از اندازه کافی در فراداده وجود دارد تا مشخص شود با چه کسی ارتباط دارید، زمانی که با آنها صحبت میکنید، و به طور بالقوه حتی حرکات خود را جمعآوری میکنید.
آیا فراداده یک نگرانی حفظ حریم خصوصی است؟
اکثر فایلهای دیجیتالی موجود در آنجا دارای برخی ابردادههای مرتبط با آن هستند. گاهی اوقات خود فایل حاوی ابرداده است و گاهی اوقات، ابرداده بهطور جداگانه توسط سیستم عامل ذخیره میشود. اکثر ویدیوها و تصاویر آپلود شده در اینترنت اکنون به صورت خودکار ابرداده های آنها حذف می شوند – تمام سایت های رسانه های اجتماعی بزرگ و اکثر پلت فرم های میزبانی تصویر ابرداده ها را حذف می کنند، و همچنین اکثر برنامه های چت مدرن از جمله Slack، Discord، WhatsApp، Facebook Messenger، Signal، و تلگرام شامل این موضوع هستند
هشدار: آپلود عکسهای شما در یک سرویس ذخیرهسازی ابری، ابردادهها را حذف نمیکند، بنابراین مراقب اشتراکگذاری عکسها از این طریق باشید. ارسال تصاویر از طریق ایمیل نیز ابرداده ها را حذف نمی کند.
مهمتر از همه، هر کاری که انجام می دهید متادیتا تولید می کند. هر زمانی که داده ها را از طریق شبکه تلفن همراه یا اینترنت ارسال یا دریافت می کنید، ابرداده ایجاد می شود. این داده ها به طور یکسان جمع آوری می شود و می تواند برای تجزیه و تحلیل رفتار افراد یا گروه ها استفاده شود.
با در نظر گرفتن اینکه فراداده تا چه حد در همه جا حاضر است و چقدر می تواند آشکار باشد بدون تردید یک نگرانی حفظ حریم خصوصی است.
بیشتر دستگاههای هوشمند اطلاعات استفاده را جمعآوری میکنند و اینترنت اشیا (IoT) آماده است تا حجم دادهها و ابردادههای جمعآوریشده را افزایش دهد. اقداماتی را که می توانید برای محافظت از حریم خصوصی خود انجام دهید و در هنگام آپلود اطلاعات در اینترنت احتیاط کنید.