یادداشت

فناوری کــلان داده BIG DATA (قسمت اول)

همه‌ ما بـا شنیدن Big Data یـا کلان داده تا حدی می‌توانیم معنای آن را حدس بزنیم: به زبان ساده می‌توان گفت موضوع Big Data، به حجم زیاد داده‌ها مربوط است، حجمی که هر روز نیز رو به افزایش است و هر یک از ما در هر مقیاسی که فعال باشیم، جلوه‌هایی از آن را مشاهده و تجربه کرده‌ایم.

فناوری کلان داده یک اصطلاح گسترده است که تمام ابزارهای مورد استفاده برای تجزیه و تحلیل داده‌ها، پردازش داده‌ها و استخراج داده‌ها را در بر می‌گیرد. آنهـا می‌تواننـد ساختـارهـای داده بسیـار پیـچیـده را مـدیـریت کننـد و بـه کشـف الگوهای مفیـد و بینش‌های تجـاری به طور مؤثر کمک کنند.

کلان داده‌ها همچنیـن هنگام ترکیـب بـا سایـر فنـاوری‌های هوشمنـد مانند اینترنت اشیاء (IoT)، یادگیری ماشینی (ML) و هوش مصنوعـی (AI) مدیریت داده‌ها را در زمان واقعی ارائه می‌دهند.

تعریف کلان داده از دیدگاه گارتنر:

Big Data به معنای دارایی‌های اطلاعاتی [یک مجموعه یا سازمان] است که:

* حجم بالا دارند

* با سرعت زیاد تولید می‌شوند و / یا تنوع گسترده دارند و نیازمنـد شیوه‌هـای پـردازش نـوآورانه با هـزینـه منـاسب هستنـد تـا بتـوان از آن‌ بـرای اتوماسیـون فرایندها، تصمیم‌گیری و بـهبـود شـهـود و بیـنـش [در سـازمـان] بهره گرفت.

مدل 3V بیگ دیتا (Big 3V Model):

در اغلب تعریف‌هـای کلان داده، سه اصطلاح حجـم (Volume)، سـرعت (Velocity) و تنـوع (Variety) را می‌بینید. در حـدی که گاهی برای تـعـریف Big Data از اصطـلاح 3V استـفـاده می‌کنند که شـرح آن به اختصار بصـورت زیر می شود:

* حجم زیاد داده در بسیاری از محیط‌ها

* طیف گسترده ای از انواع داده ها که اغلب در سیستم های داده های بزرگ ذخیره می شوند.

* و سرعتی که در آن بسیاری از داده ها تولید، جمع آوری و پردازش می‌شوند. ایـن ویـژگـی‌هـا اولـیـن بـار در سـال 2001 تـوسط داگ‌لیـن، تحلیلگر شـرکت مشـاوره Meta Group Inc ارائه شده است. گارتنر پس از تصاحب Meta Group در سال 2005، آنها را بیشتر محبوب کرد.

اخیراً چندین V دیگر به توصیف‌های مختلف داده‌هـای بزرگ از جمله صحت (veracity) و ارزش (value) اضافه شده است. اگرچه داده‌های بزرگ با حجم خاصی از داده برابری نمی‌کند، استقرار داده‌های بزرگ اغلب شامل ترابایت، پتابایت و حتی اگزابایت داده، ایجاد و جمع‌آوری شده در طول زمان است.

چرا کلان داده مهم است؟

شرکت‌ها از داده‌های بـزرگ در سیستـم‌های خود برای بهبود عملیات، ارائه خدمات بهتر به مشتریان، ایجاد کمپین‌های بازاریابی شخصی و سایر اقداماتی که در نهایت می‌توانند درآمد و سود را افزایش دهند، استفاده می‌کنند. کسـب‌وکـارهایـی که از کـلان داده استفـاده می‌کنند به طور مؤثر دارای مزیت رقـابتی بالقوه نسبت به آنهایی هستند که این کار را نمی‌کنند، زیرا می‌توانند سریع‌تر و آگاهانه‌تر تصمیم‌گیری کنند.

به عنـوان مثال، داده‌هـای بزرگ بینش‌‌هـای ارزشمندی را در مورد مشتریان ارائه می دهد که شرکت ها می توانند از آنها برای اصلاح بازاریابی، تبلیغات و تبلیغات خود به منظور افزایش تعامل مشتری و نرخ تبدیل استفاده کنند. داده‌ها را می‌توان برای ارزیابی محصولات در حال تحول مصرف کنندگان یا خریداران شرکتی تجزیه و تحلیل کرد و به کسب و کارها این امکان را می‌دهـد تا به خواسته‌ها و نیازهـای مشتری پاسخگوتر باشند.

داده‌های بزرگ، همچنین توسط محققان پزشکی برای شناسایی علائم بیماری و عوامل خطـر و تـوسط پـزشکـان بـرای کمـک بـه تشخیـص بیماری‌ها و شرایط پزشکی در بیماران استفاده می‌شود. علاوه بـر ایـن، ترکیبـی از داده‌های سـوابق الکترونیکـی سلامـت، سـایت‌های رسانه‌های اجتماعـی، وب و سایـر منابع بـه سازمان‌های مراقبت‌هـای بهداشتـی و سازمـان‌های دولتی، اطلاعـات بـه‌روز دربـاره تهدیـدات یـا شیـوع بیماری‌های عفونی می‌دهد.

در اینجا چند نمونه دیگر از نحوه استفاده از داده های بزرگ توسط سازمان ها آورده شده است: در صنعت انرژی، کلان داده به شرکت‌های نفت و گاز کمک می‌کند تا مکان‌های حفاری احتمالی را شناسایی کرده و عملیات خط لوله را نظارت کنند. به همیـن ترتیب، شرکت‌های بـرق از آن بـرای ردیابی شبکه های برق استفاده می کنند.

شرکت های خدمات مالی از سیستم های کلان داده برای مدیریـت ریسک و تجزیـه و تحلیل بلادرنگ داده های بازار استفاده می کنند. تولیدکنندگان و شرکت های حمل و نقل برای مدیریت زنجیـره تأمین خـود و بهینه سـازی مسیرهای تحویـل به داده‌های بزرگ متکی هستند.

سایر کاربردهای دولت شامل واکنش اضطراری، پیشگیری از جـرم و ابتکارات شهر هوشمند است.

نمونه هایی از داده های بزرگ

داده‌های بزرگ از منابع بی‌شماری به دست می‌آیند – برخی از نمونه‌ها عبارتند از: سیستـم‌هـای پـردازش تـراکنش، پـایگاه‌هـای داده مشتـریان، اسنـاد، ایمیل‌ها، سوابـق پـزشکی، گزارش‌های جریـان کلیک اینترنتی، شبکه‌های اجتماعی مانند فیسبوک، اینستاگرام و … همچنین شامل داده‌های تولید شده توسط مـاشین، مانند فایل‌های گزارش شبکه و سرور و داده‌های حسگرهای ماشین‌های تولیدی، تجهیزات صنعتی و دستگاه‌های اینترنت اشیاء است.

علاوه بر داده‌های سیستم‌های داخلی، محیط‌های کلان داده اغلب داده‌های خارجی در مورد مصرف‌کنندگان، بازارهای مالی، شرایط آب و هوایی و ترافیک، اطلاعات جغرافیایی، تحقیقات علمی و موارد دیگر را در خود جای می‌دهند. تصاویر، ویدئوها و فایل‌های صوتی نیز فرم‌هایی از داده‌های بزرگ هستند و بسیاری از برنامه‌های کاربردی داده‌های بزرگ شامل جریان داده‌هایی هستند که به‌طور مستمر پردازش و جمع‌آوری می‌شوند. مدیریت Big Data وابسته به سیستم­‌هایی است که توانـایی پردازش و تحلیل مقادیر زیادی از اطلاعات متفاوت و پیچیده را دارند.

در ایـن راسـتـا، Big Data و AI تـا حـدودی رابطـه‌ای متقابل دارند. Big Data بدون هوش مصنوعی برای سازمـاندهی و تجزیه و تحلیـل آن، کاربرد عملـی زیادی نخواهد داشت و میزان دقت تحلیـل‌هـای هـوش مصنوعـی به وسعت مجموعـه‌ داده‌های موجود در کلان داده بستگی دارد.

منابع: https://www.coursera.org/

Fuel Your Pipeline Faster

Datamation Homepage: Emerging Enterprise Tech Analysis and Products

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

همچنین ببینید
بستن
دکمه بازگشت به بالا