التحليلات (ANA-S)

نموذج/وحدة علم البيانات المرافق

لا حاجة إلى أية أدوات إضافية

من خلال التقنية المدعومة بلغة بايثون (Python) والمدمجة في برنامج TURBOARD، لا حاجة لنقل مخرجات البيانات بغرض تنفيذ عمليات التحليلات البيانية وعلم البيانات باستخدام أدوات أخرى خارجية.

كذلك لست بحاجة إلى معرفة أي شيء عن بايثون. كل ما تحتاج إلى معرفته هو كيفية استخدام الماوس.


سهولة البدء

يسهل لك برنامج تيربورد عملية البدء في استغلال واستخدام علم البيانات إذ لن تحتاج إلى إعداد مجموعات البيانات بأدوات وتطبيقات خارجية منفصلة. ستتمكن من تجهيز وتنظيف بياناتك وإنشاء عينات البيانات مباشرة في البرنامج والبدء في تحليلها ونمذجتها في واجهة مستخدم تيربورد للتحليلات.


ربط التطبيق بالبيانات الحية

لدى إعداد أي نموذج تحليلي من خلال برنامج تيربورد، يتم تطبيقه وتنفيذه على كامل مجموعة البيانات وليس فقط على عينة واحدة. إن فلاتر ذكاء الأعمال في البرنامج تعمل جنباً إلى جنب مع تعبيرات التحليلات البيانية. على سبيل المثال، يمكنك مقارنة خط الانحدار في منطقة ما من بيانات البلد بأكملها أو معرفة في أي مناطق عملك كانت تنبؤاتك أكثر دقة.


توفر دليل استخدام عام

  1. قم باختيار عينة البيانات.
  2. اترك معلمات تحليل البيانات بالإعدادات الافتراضية لها، وقد تقوم بتغييرها لاحقاً.
  3. قم باختيار متغير هدف بقيمة رقمية واختر متغيرات المصدر.
  4. سيتم إنتاج صيغة تتنبأ بالهدف في معظم الحالات باستخدام هذه المتغيرات.
  5. تحقق من جودة التحليل باستخدام الأدوات المحددة المتوفرة.
  6. قم بإنشاء لوحة المعلومات التلقائية في تيربورد.

تقنيات تعلّم الآلة باستخدام خوارزميات الانحدار

توضيح

تحاول خوارزميات الانحدار العثور على صيغة تطابق العينة بشكل أفضل من أجل التنبؤ بقيمة مستهدفة من عدة متغيرات (ويفضل أن تكون مستقلة).

على سبيل المثال، تخيل أن لديك البيانات الخاصة بجميع رحلات التاكسي في مدينة ما (الكيلومترات المقطوعة، وزمن الرحلات، والرسوم المدفوعة لكل رحلة). سينتج عن تحليل الانحدار أفضل صيغة تناسب غالبية رحلات التاكسي. إن مربع معامل ارتباط العينة (r2) هو مقياس جودة للانحدار، ويصف النسبة المئوية لأخذ العينات التي يتم تحديدها بدقة وفقاً للصيغة. إذا كانت قيمة r2 تساوي 0.9 مثلاً، فهذا يعني أن الصيغة تحدد بنسبة دقة 90٪ من كامل رحلات التاكسي.

ما هي الخوارزميات الممكن استخدامها؟

في TURBOARD، يمكنك استخدام نماذج الانحدار الخطي ومتعدد الحدود.

الاستخدامات والتطبيقات العملية الممكنة

  1. كم سيصبح حجم المبيعات إذا قمنا بتغيير سعر المنتج مع تغيير سعر المنتجات البديلة/المنافسة؟
  2. احسب ناتج الآلات وفقاً لجميع المعلمات الهندسية لغاية الوقت الحالي. حدد الآلات ذات الأداء المتفوق والمتأخرة.
  3. بناءً على بياناتك الخاصة بمئات المشاريع ومعلماتها المختلفة، يمكنك تحديد معلمة جديدة للمشاريع المستقبلية. على سبيل المثال، قد تكون قادراً على التنبؤ بإجمالي نفقات المشروع بناءً على عدد الأشخاص (مع تعييناتهم) والعوامل الجغرافية والزمنية. يمكنك حتى استخدام البيانات الترتيبية مثل خطورة المشروع وصعوبة الشروط.

ما الذي يجب التحقق منه للحصول على أفضل النتائج؟

  1. تحقق من قيمة مربع معامل ارتباط العينة (r2) في التعبيرات التي أنشأتها "Generated Expression" بعد تحديد كل معلمة مصدر للتأكد من أن لديك أكثر المعلمات ذات الصلة للتنبؤ بالمتغير الهدف. كلما زادت قيمة (r2)، كان تنبؤك أفضل.

ما طبيعة لوحة البيانات الناتجة؟

  1. سينتج مخططات مبعثرة.
  2. قد ترغب في استخدام التنسيق الشرطي لاستنباط المزيد من المخططات المبعثرة.

عينة من النتائج النهائية (من البيانات المفتوحة)

  1. مقارنة المشاريع بمعلماتها المتوقعة والحقيقية. شاهد الفيديو أدناه.

التنبؤ باستخدام خوارزميات التصنيف

توضيح

بالنظر إلى المتغير المستهدف، ستتعلم خوارزمية التصنيف كيف ستقرر البيانات ذلك المتغير المستهدف المحدد وفي المعلمات الجديدة سوف تتنبأ بمخرجات.

ما هي الخوارزميات الممكن استخدامها؟

آلة المتجهات الداعمة (SSVM) والانحدار اللوجستي هما من الخوارزميات المتاحة ضمن تيربورد والتي يمكن استخدامها دون الحاجة إلى كتابة سطر برمجي واحد.

الاستخدامات والتطبيقات العملية الممكنة

  1. تحليل معدل الاستنزاف (Churn Analysis) للعملاء: استخدم بيانات العملاء الخاصة بك، وقم بتمييز العملاء النشطين والذين على وشك التوقف عن استخدام خدماتك. سوف يقوم برنامج TURBOARD باستخلاص نتيجة النموذج من البيانات الحالية المتاحة للتنبؤ بما إذا كنت ستفقد العميل أم لا، حتى تتمكن من اتخاذ الإجراء المناسب قبل فوات الأوان.
  2. توقع فشل الآلات وتوقفها: استخدم بيانات أجهزتك التي فشلت سابقاً وتوقع أي آلة أكثر عرضة للفشل والتعطل في المستقبل القريب.

ما الذي يجب التحقق منه للحصول على أفضل النتائج؟

  1. تحقق من مصفوفة الارتباك (جدول يعرض التنبؤ مقابل الحقيقي) الذي سيتم توفيره في لوحة البيانات وسيكون أحد التصورات الافتراضية التي سيتم إنشاؤها. يشير التكثيف على المصفوفة القطرية أن الخوارزمية تقوم بعملها بنجاح.
  2. تحقق من منحنى مميزات المستقبل (ROC) لمعرفة أداء نموذج التصنيف مقارنة بفترات تصنيف مختلفة.

ما طبيعة لوحة البيانات الناتجة؟

  1. مصفوفات الارتباك التي يمكن استخدامها كتقطيع وتشريح بحيث يمكنك فقط النقر فوق المصفوفة وفلترة/تصفية النتائج.
  2. مراقبة بصرية وتفحص مرئي للألوان والتجمعات في مخططات مبعثرة ملونة إقليمية متعددة الأضلاع. انظر صورة "التنبؤ بالطقس" أدناه.
  3. تُظهر المخططات العمودية مجموعات النتائج حسب الفئات والمقاييس المختلفة المستخدمة.

عينة من النتائج النهائية (من البيانات المفتوحة)

  1. توقعات حالة الطقس. انقر الصورة أدناه.
  2. توقعات الإفلاس. انقر الصورة أدناه.

التنقيب في البيانات باستخدام خوارزميات التجميع

توضيح

بالنظر إلى أي عدد من المعلمات، ستنشئ خوارزميات التجميع مجموعات من الكيانات بناءً على تقاربها.

ما هي الخوارزميات الممكن استخدامها؟

خوارزمية تجميع كي-المتوسط (K-means) وخوارزمية تجميع التحول (Mean Shift) هما من الخوارزميات المتوفرة ضمن مستودع النماذج الإحصائية لبرنامج تيربورد.

الاستخدامات والتطبيقات العملية الممكنة

  1. قم بتصنيف عملائك ضمن مجموعات وإعداد حملات تسويقية مناسبة لكل مجموعة مستهدفة.
  2. Pالأطباء الذين أجروا عمليات قيصرية مجمعين حسب ترتيبهم وموقعهم الجغرافي ونوع المستشفى. قم بالفلترة/التصفية حسب أيام الأسبوع وشاهد التغييرات في البيانات الحية الحقيقية.

ما الذي يجب التحقق منه للحصول على أفضل النتائج؟

  1. فقط تحقق من المجموعات في المخططات الناتجة فيما يتعلق بوضعها.
  2. استخدم المجموعات كفلاتر وتحقّق من لوحة معلومات تيربورد لمعرفة ما إذا كانت كل مجموعة منطقية أم لا.

ما طبيعة لوحة البيانات الناتجة؟

  1. سيقوم برنامج TURBOARD بإنشاء مخططات مبعثرة مضلعة مجمعة لأزواج من المعلمات. نظراً لأنه من غير الممكن تمثيل الأبعاد الفضائية الزائدة بطريقة يمكن للبشر فهمها، فإن هذه المقاطع العرضية هي الطريقة الوحيدة لإظهار نتائج النموذج.

عينة من النتائج النهائية

  1. مجموعة بيانات زهرة السوسنة (فيشر) (Iris). شاهد الفيديو أدناه.

البحث عن الأنماط المخفية

البحث عن الأنماط المخفية

  1. الرسم البياني الشبكي: وهو ليس فقط نوعاً من تصورات اللوحات البيانية بل أداة تحليلية.
  2. تجريف البيانات (P-hacker): تستخدم هذه الأداة لتقطيع البيانات من أجل العثور على أفضل ارتباط بين المتغيرات المختارة.

ما هي الخوارزميات الممكن استخدامها؟

  1. الرسم البياني الشبكي يستخدم خوارزمية توزيع T للإدراج العشوائي المجاور (t-SNE) أو تحليل المكون الرئيسي (PCA).
  2. تجريف البيانات (P-hacking) هو أداة هجينة.

الاستخدامات والتطبيقات العملية الممكنة

  1. يمكنك معرفة أي المواد/المنتجات المباعة في الفروع هي الأكثر حساسية لتغيرات الأسعار.

ما الذي يجب التحقق منه للحصول على أفضل النتائج؟

  1. على الرسم البياني الشبكي، ستُظهر خوارزمية t-SNE البيانات المتشابهة بالقرب من بعضها البعض وبصورة منظمة.
  2. يمكنك استخدام TURBOARD لإضافة مجموعات أخرى واكتشاف الحالات الشاذة.

ما طبيعة لوحة البيانات الناتجة؟

  1. رسم بياني شبكي.
  2. تمثيل ثنائي الأبعاد على المخطط المبعثر.
  3. مخطط ثلاثي الأبعاد.

عينة من النتائج النهائية

  1. مجموعات لاعبي كرة القدم فيفا 19. شاهد الفيديو أدناه.
  2. شركات الأدوية مجمعة حسب استقرارها المالي. شاهد الفيديو أدناه.

المحاكاة الافتراضية (ماذا لو؟) المدعومة بالذكاء الاصطناعي

توضيح

تعد تقارير (ماذا لو) التي يقدمها تيربورد فريدة من نوعها من حيث أنها يمكن أن تستخدم نماذج إحصائية ضمن تحليل المحاكاة الافتراضية (What-If). على سبيل المثال، من الممكن توقع أن زيادة سعر منتج ما بنسبة 20٪ لن يؤدي بالضرورة إلى زيادة حجم المبيعات بالمقدار نفسه (أي بنسبة 20٪)، إذ قد يتنبأ الذكاء الاصطناعي بانخفاض المبيعات عند رفع السعر.

ما هي الخوارزميات الممكن استخدامها؟

  1. يمكن استخدام الانحدار الخطي أو متعدد الحدود.
  2. يمكنك استخدام المعلمات جنباً إلى جنب مع التعبيرات المدعومة بالتحليلات.

الاستخدامات والتطبيقات العملية الممكنة

  1. ضع في اعتبارك البدائل والمنتجات التكميلية وأسعار السوق المنافسة وتوقع حجم المبيعات عن طريق محاكاة تغيرات الأسعار. ارفع حجم أرباحك إلى أقصاه من خلال تحديد أفضل الأسعار. تحقق من الفيديو في صفحة "حزمة حلول سلاسل محلات البقالة" ضمن نافذة "التسعير".
  2. حدد ميزانيتك السنوية من خلال التلاعب بفئات الميزانية الوظيفية والاقتصادية والإدارية. استهدف الميزانية الإجمالية للعام المقبل. قم بتحديد آثار التسويات قبل إقرار الميزانية وليس بعدها.

ما الذي يجب التحقق منه للحصول على أفضل النتائج؟

  1. استخدم وظيفة استنساخ لوحات البيانات في TURBOARD والمحمية ببراءة اختراع لملاحظة التغييرات في لوحة بيانات "ماذا لو" ومقارنتها مع البيانات الحقيقية في لوحة البيانات المجاورة.

ما طبيعة لوحة البيانات الناتجة؟

  1. يمكن تطبيق المحاكاة الافتراضية "ماذا لو" على أي لوحة معلومات ليس لنوع التحليل لها أية لوحات معلومات مُنشأة تلقائياً.

عينة من النتائج النهائية

  1. إذا انتهى الأمر بالشركات التي يُتوقع إفلاسها إلى الإفلاس، فكم عدد الأشخاص الذين سيصبحون عاطلين عن العمل العام المقبل؟ شاهد الفيديو أدناه.
  2. إذا قمت بتغيير سعر الأفوكادو العضوي، فكيف سيؤثر ذلك على حجم مبيعات كل من الأفوكادو العضوي والتقليدي؟ شاهد الفيديو أدناه.

استكشف أفكاراً ورؤى قيّمة ومدهشة مدفونة في بياناتك من خلال برنامج

جرب الآن!
هل انت فضولي؟