ال Big Data وعربيات بتجرها خيول ... دليل سريع لتعرف المزيد عن البيانات الضخمة

دليلك السريع عن البيانات الضخمة Big Data 

القصة وراء الBig Data 

زمان الناس كانت بتسافر من قرية لقرية عن طريق عربية بيجرها حصان ومع الوقت وتطور البشرية القرية بقت مدينة واحتياجات الناس بيزيد وبقينا محتاجين نسافر اسرع وننقل كميات اكبر فظهر لينا اقتراح من شخص عبقري لية نستخدم حصان واحد لما ممكن نستخدم 4 احصنة فعلا النظرية دي اثبتت صحتها وانها فعالة فعلا وقدرنا نسافر اسرع وننقل بضايع اكتر . 

بنفس المنطق لو طبقناه علي Data هنلاقينا لفترة قريبة كنا بنتعامل مع داتا محدودة وكمان الوقت اللي محتاجينة عشان نتعامل مع البيانات دي كان معقول, لكن مع تطور التكنولوجيا وظهور حاجات زي social media , internet of things اصبح عندنا كمية كبيرة جدا من الداتا محتاجين نتعامل معها بسرعة تناسب سرعة زيادة الداتا دي وده خلي يبدا عصر Big Data.

معدل زيادة ال Big Data 
الحقيقه ان معدل زيادة كمية البيانات نقدر نقول ان بيتضاعف كل سنية ماشي في منحي علاقة اسية 
وده راجع لعوامل كتير اهمها اختراع ال ⁧ web واللي ربط الناس كلها بالانترنت وكل حاجة بنعملها علي النت تعبتر جزء من البيانات دي . 
من اهم المصادر للبيانات دي هي 
  • مواقع التواصل الاجتماعي. 
  • الموابيلات الذكية 
  • التجارة الالكترونية 
  • انترنت الاشياء والحساسات الخاصة بية 
بيتوقع الباحثون اننا في عام 2020 هيوصل كمية البيانات ل 40 زيتا بايت (2 اس 70) واللي بيساوي حبات الرمل علي الكوكب مضروبة في 75 . كل ده يرجعنا لسؤال مهم اية هي big data 

ما هي ال Big Data 

" هي مجموعة البيانات الضخمة والمعقدة واللي بيصعب تنظيمها باستخدام الطرق التقليدية. 
وده بيخلي في تحديات كتير بنقابلها زي تجميع البيانات دي وتخزينها وتصنيفها والبحث فيها ونقلها وتحليها ومشاركتها. 

خصائص الBig Data 

في خمس خصائص مميزة للبيانات الضخمة وهم
 "الحجم-Volume"  / "السرعة-Velocity" / "التنوع-Variety" / "الدقة-Veracity" / "القيمة-Value

الحجم Volume

كمية البيانات الكبيرة جدا جدا  اللي بتطلع كل يوم عن اليوم اللي قبلة , البيانات دي ناتجة عن البشر والالات والتعامل بينهم . لدرجة ان العلماء بيتوقعو ان في 2020 هيكون في 40 زيتا بايت 

السرعة Velocity

لو ركزنا في كمية الداتا هنلاقيها بتنمو بسرعة جدا نتيجة وجود مصادر كتير ليها. وبالتالي لازم نقدر نتعامل مع سرعة نمو البيانات دي عشان نقدر ناخد قرارت بناء علي Real time data 

التنوع Variety 

مع تعدد مصادر البيانات هنلاقي انواع مختلفة من البيانات ما بين صور وفيديوهات وكلمات وبيانات الحساسات المستخدمة في IOT  ولكن اشهر تنصيف هيكون من حيث مدي تنظيمها فهنلاقي ان في بيانات منظمة  Structured Data - بيانات شبة منظمة Semi Structured Data وبيانات غير منظمة unstructured Data. وهنا ظهر تحدي جديد في التعامل مع الداتا الغير منظمة وازاي استفيد منها. 

الدقة Veracity 

مع الحجم الهايل وكمية البيانات وسرعة نموها بقي صعب جدا اعرف فين الداتا الحقيقه ومدي دقة البيانات دي. 
فكر في تويتر واللي بينظم البيانات بناء علي الهاشتاج وبالتالي في كام تويتة فيها هاشتاج ملهوش دعوه بمحتوي التويتة نفسها وده خلي في تخوف كبير من البيانات دي وخسر دولة زي امريكا اكتر من 3.1 ترليون دولار في السنة. 

القيمة Value

هل لما اعمل تحليل للداتا دي كلها واشتغل عليها هيكون لنتايج قيمة هل العائد المادي علي المستثمرين كويس هل فعلا الكمية الضخمة من البيانات دي ليها قيمة حقيقه نقدر نستفيد منها. 

انواع البيانات 

زي ما قولنا ان في انواع كتير للداتا فخلينا نتكلم بتفاصيل اكتر عن الانواع دي 

البيانات المنظمة - Structured Data 

هي البيانات التي يمكن ان تخزن وتعالج في شكل معين معروف من اشهر امثلتها هي RDBMS 

البيانات الشبة منظمة Semi Structured Data 

بيانات ليس لديها شكل ثابت لكن لها بعض الخصائص المميزة والتي يمكن التعامل معاها من خلالها من امثلتها ملفات XML 

البيانات الغير منظمة Unstructured Data 

هي بيانات ليس لديها شكل معين فلا يمكن تخزينها او التعامل معها الا لو حولت لبيانات منظمة من امثلتها ملفات الصوت والصورة والنصوص. 

تطبيقات علي Big Data 

بعد ما اتكلمنا يعني اية بيانات ضخمة ومقدمة سريعة عنها تعالو نعرف اهم تطبيقاتها 
في الصحة : بجمع بيانات المرضي وتحليها يمكن تصميم تطبيق يستطيع التنبوء بالامراض 
في التصنيع : باستخدماها في التصنيع نستطيع التنبئ بالاعطال وزيادة الكفاءة والجوده 
في الاتصالات : باستخدام كمية البيانات من الهواتف نستطيع تحسين جودة الشبكة
في مجالات عديدة اخري كالتعليم والجودة والمرور وغيرها 

اهم التحديات

جوده البيانات /

واحدة من اخطر التحديات لان البيانات الغير مكتملة بتكلف الشركات مبالغ ضخمة. 

الاحصائيات /

انك تطلع احصائية من كمية البيانات الضخمة دي زي انك تطلع ابرة من كوم قش بيحتاج لخوارزميات معقده جدا عشان نقدر نحللها ونحصل علي نتايج 

التخزين / 

مع كمية البيانات الضخمة دي بيظهر سؤال مهم نخزن البيانات دي فين. 

الحماية / 

مع كمية البيانات دي انك تحافظ علي خصوصيتها وامنها تحدي كبير 



كل ده مجرد مقدمة سريعة عن ال big data هدفها انك تعرف عنها اكتر مش انك تكون متخصص فيها 
لو المقال فادك ممكن تعمل share  ومتنساش تعمل  subscribe عشان يوصلك كل جديد


Comments