فناوری کــلان داده BIG DATA (قسمت اول)
همه ما بـا شنیدن Big Data یـا کلان داده تا حدی میتوانیم معنای آن را حدس بزنیم: به زبان ساده میتوان گفت موضوع Big Data، به حجم زیاد دادهها مربوط است، حجمی که هر روز نیز رو به افزایش است و هر یک از ما در هر مقیاسی که فعال باشیم، جلوههایی از آن را مشاهده و تجربه کردهایم.
فناوری کلان داده یک اصطلاح گسترده است که تمام ابزارهای مورد استفاده برای تجزیه و تحلیل دادهها، پردازش دادهها و استخراج دادهها را در بر میگیرد. آنهـا میتواننـد ساختـارهـای داده بسیـار پیـچیـده را مـدیـریت کننـد و بـه کشـف الگوهای مفیـد و بینشهای تجـاری به طور مؤثر کمک کنند.
کلان دادهها همچنیـن هنگام ترکیـب بـا سایـر فنـاوریهای هوشمنـد مانند اینترنت اشیاء (IoT)، یادگیری ماشینی (ML) و هوش مصنوعـی (AI) مدیریت دادهها را در زمان واقعی ارائه میدهند.
تعریف کلان داده از دیدگاه گارتنر:
Big Data به معنای داراییهای اطلاعاتی [یک مجموعه یا سازمان] است که:
* حجم بالا دارند
* با سرعت زیاد تولید میشوند و / یا تنوع گسترده دارند و نیازمنـد شیوههـای پـردازش نـوآورانه با هـزینـه منـاسب هستنـد تـا بتـوان از آن بـرای اتوماسیـون فرایندها، تصمیمگیری و بـهبـود شـهـود و بیـنـش [در سـازمـان] بهره گرفت.
مدل 3V بیگ دیتا (Big 3V Model):
در اغلب تعریفهـای کلان داده، سه اصطلاح حجـم (Volume)، سـرعت (Velocity) و تنـوع (Variety) را میبینید. در حـدی که گاهی برای تـعـریف Big Data از اصطـلاح 3V استـفـاده میکنند که شـرح آن به اختصار بصـورت زیر می شود:
* حجم زیاد داده در بسیاری از محیطها
* طیف گسترده ای از انواع داده ها که اغلب در سیستم های داده های بزرگ ذخیره می شوند.
* و سرعتی که در آن بسیاری از داده ها تولید، جمع آوری و پردازش میشوند. ایـن ویـژگـیهـا اولـیـن بـار در سـال 2001 تـوسط داگلیـن، تحلیلگر شـرکت مشـاوره Meta Group Inc ارائه شده است. گارتنر پس از تصاحب Meta Group در سال 2005، آنها را بیشتر محبوب کرد.
اخیراً چندین V دیگر به توصیفهای مختلف دادههـای بزرگ از جمله صحت (veracity) و ارزش (value) اضافه شده است. اگرچه دادههای بزرگ با حجم خاصی از داده برابری نمیکند، استقرار دادههای بزرگ اغلب شامل ترابایت، پتابایت و حتی اگزابایت داده، ایجاد و جمعآوری شده در طول زمان است.
چرا کلان داده مهم است؟
شرکتها از دادههای بـزرگ در سیستـمهای خود برای بهبود عملیات، ارائه خدمات بهتر به مشتریان، ایجاد کمپینهای بازاریابی شخصی و سایر اقداماتی که در نهایت میتوانند درآمد و سود را افزایش دهند، استفاده میکنند. کسـبوکـارهایـی که از کـلان داده استفـاده میکنند به طور مؤثر دارای مزیت رقـابتی بالقوه نسبت به آنهایی هستند که این کار را نمیکنند، زیرا میتوانند سریعتر و آگاهانهتر تصمیمگیری کنند.
به عنـوان مثال، دادههـای بزرگ بینشهـای ارزشمندی را در مورد مشتریان ارائه می دهد که شرکت ها می توانند از آنها برای اصلاح بازاریابی، تبلیغات و تبلیغات خود به منظور افزایش تعامل مشتری و نرخ تبدیل استفاده کنند. دادهها را میتوان برای ارزیابی محصولات در حال تحول مصرف کنندگان یا خریداران شرکتی تجزیه و تحلیل کرد و به کسب و کارها این امکان را میدهـد تا به خواستهها و نیازهـای مشتری پاسخگوتر باشند.
دادههای بزرگ، همچنین توسط محققان پزشکی برای شناسایی علائم بیماری و عوامل خطـر و تـوسط پـزشکـان بـرای کمـک بـه تشخیـص بیماریها و شرایط پزشکی در بیماران استفاده میشود. علاوه بـر ایـن، ترکیبـی از دادههای سـوابق الکترونیکـی سلامـت، سـایتهای رسانههای اجتماعـی، وب و سایـر منابع بـه سازمانهای مراقبتهـای بهداشتـی و سازمـانهای دولتی، اطلاعـات بـهروز دربـاره تهدیـدات یـا شیـوع بیماریهای عفونی میدهد.
در اینجا چند نمونه دیگر از نحوه استفاده از داده های بزرگ توسط سازمان ها آورده شده است: در صنعت انرژی، کلان داده به شرکتهای نفت و گاز کمک میکند تا مکانهای حفاری احتمالی را شناسایی کرده و عملیات خط لوله را نظارت کنند. به همیـن ترتیب، شرکتهای بـرق از آن بـرای ردیابی شبکه های برق استفاده می کنند.
شرکت های خدمات مالی از سیستم های کلان داده برای مدیریـت ریسک و تجزیـه و تحلیل بلادرنگ داده های بازار استفاده می کنند. تولیدکنندگان و شرکت های حمل و نقل برای مدیریت زنجیـره تأمین خـود و بهینه سـازی مسیرهای تحویـل به دادههای بزرگ متکی هستند.
سایر کاربردهای دولت شامل واکنش اضطراری، پیشگیری از جـرم و ابتکارات شهر هوشمند است.
نمونه هایی از داده های بزرگ
دادههای بزرگ از منابع بیشماری به دست میآیند – برخی از نمونهها عبارتند از: سیستـمهـای پـردازش تـراکنش، پـایگاههـای داده مشتـریان، اسنـاد، ایمیلها، سوابـق پـزشکی، گزارشهای جریـان کلیک اینترنتی، شبکههای اجتماعی مانند فیسبوک، اینستاگرام و … همچنین شامل دادههای تولید شده توسط مـاشین، مانند فایلهای گزارش شبکه و سرور و دادههای حسگرهای ماشینهای تولیدی، تجهیزات صنعتی و دستگاههای اینترنت اشیاء است.
علاوه بر دادههای سیستمهای داخلی، محیطهای کلان داده اغلب دادههای خارجی در مورد مصرفکنندگان، بازارهای مالی، شرایط آب و هوایی و ترافیک، اطلاعات جغرافیایی، تحقیقات علمی و موارد دیگر را در خود جای میدهند. تصاویر، ویدئوها و فایلهای صوتی نیز فرمهایی از دادههای بزرگ هستند و بسیاری از برنامههای کاربردی دادههای بزرگ شامل جریان دادههایی هستند که بهطور مستمر پردازش و جمعآوری میشوند. مدیریت Big Data وابسته به سیستمهایی است که توانـایی پردازش و تحلیل مقادیر زیادی از اطلاعات متفاوت و پیچیده را دارند.
در ایـن راسـتـا، Big Data و AI تـا حـدودی رابطـهای متقابل دارند. Big Data بدون هوش مصنوعی برای سازمـاندهی و تجزیه و تحلیـل آن، کاربرد عملـی زیادی نخواهد داشت و میزان دقت تحلیـلهـای هـوش مصنوعـی به وسعت مجموعـه دادههای موجود در کلان داده بستگی دارد.
منابع: https://www.coursera.org/
Datamation Homepage: Emerging Enterprise Tech Analysis and Products