contador Saltar al contenido

الفرق بين التصنيف والكتلة

mayo 6, 2020
الفرق بين التصنيف والكتلة


التصنيف والعودة مشكلتان رئيسيتان في التنبؤ يتم تناولهما بشكل عام في استخراج البيانات. النمذجة التنبؤية هي تقنية تطوير نموذج أو وظيفة باستخدام البيانات التاريخية للتنبؤ بالبيانات الجديدة. الفرق الكبير بين التصنيف والإرجاع هو أن التصنيف يعيّن كائن بيانات الإدخال إلى بعض التسميات المنفصلة. من ناحية أخرى ، يقوم الإرجاع بتعيين كائن بيانات الإدخال إلى القيم الحقيقية المستمرة.

مخطط المقارنة

أساس المقارنةالتصنيف
أساسي اكتشاف النماذج أو الوظائف التي يتم فيها تعيين الكائنات في فئات محددة مسبقًا. نموذج تم إنشاؤه يتم فيه تعيين الكائنات في القيم.
أنها تنطوي على التنبؤ قيم منفصلة القيم المستمرة
الخوارزميات شجرة القرار ، والعودة اللوجستية ، وما إلى ذلك. شجرة العودة (غابة عشوائية) ، عودة خطية ، إلخ.
طبيعة البيانات المتوقعة في الراتب طلب
طريقة الحساب أحتاج القياس الجذر الجذر قياس الخطأ المربع

تعريف التصنيف

التصنيف عملية إيجاد أو اكتشاف نموذج (وظيفة) يساعد على فصل البيانات إلى فئات فئوية مختلفة. في التصنيف ، تم تحديد الارتباط بمجموعة المشكلات ، مما يعني أنه يتم تصنيف البيانات تحت تسميات مختلفة وفقًا لبعض المعلمات ثم يتم توقع التسميات للبيانات.

يمكن إظهار النماذج المشتقة في شكل قواعد IF-THEN ، أشجار القرار أو الشبكات العصبية ، إلخ. واحد شجرة القرار بشكل أساسي مخطط انسيابي يشبه بنية الشجرة حيث تمثل كل عقدة داخلية اختبارًا على سمة ، وتظهر فروعها نتيجة الاختبار. تتعامل عملية التصنيف مع المشكلات التي يمكن من خلالها تقسيم البيانات إلى تصنيفين منفصلين أو أكثر ، بمعنى آخر ، مجموعتان منفصلتان أو أكثر.

لنأخذ مثاللنفترض أننا نريد التنبؤ بإمكانية هطول الأمطار في بعض المناطق بناءً على بعض المعلمات. ثم سيكون هناك تصنيفان ممطران وغير مؤلمين يمكن بموجبهما تصنيف مناطق مختلفة.

تعريف الإرجاع

العودة عملية إيجاد نموذج أو وظيفة لتمييز البيانات إلى قيم حقيقية مستمرة بدلاً من استخدام الفئات. من الناحية الرياضية ، مع مشكلة الإرجاع ، يحاول المرء إيجاد تقريب الدالة مع الحد الأدنى من انحراف الخطأ. في المقابل ، من المتوقع الاعتماد على البيانات العددية لتمييزها.

تحليل المرتجعات هو النموذج الإحصائي المستخدم للتنبؤ بالبيانات الرقمية بدلاً من التسميات. يمكنك أيضًا تحديد حركة التوزيع اعتمادًا على البيانات المتاحة أو البيانات التاريخية.

هيا بنا مثال وهو مماثل في المقابل أيضًا ، حيث نجد إمكانية هطول الأمطار في بعض المناطق المحددة بمساعدة بعض المعلمات. في هذه الحالة ، هناك احتمال مرتبط بالمطر. نحن هنا لا نقوم بتصنيف المناطق داخل المطر وبدون تسميات المطر ، بدلاً من ذلك نقوم بتصنيفها مع الاحتمالية المرتبطة بها.

الاختلافات الرئيسية بين التصنيف والعودة

  1. تشكل عملية التصنيف نموذجًا يتم من خلاله توفير البيانات في تصنيفات الفصل المنفصلة. من ناحية أخرى ، فإن عملية إنشاء نموذج يتنبأ بإرجاع الكمية المستمرة.
  2. تتضمن خوارزميات التصنيف شجرة القرار والعودة اللوجيستية وما إلى ذلك. في المقابل ، تعد شجرة العودة (مثل الغابة العشوائية) والعودة الخطية أمثلة لخوارزميات العودة.
  3. يتنبأ التصنيف ببيانات غير مرتبة ، بينما يتنبأ الإرجاع ببيانات مرتبة.
  4. يمكن تقييم الانحدار باستخدام الخطأ التربيعي المتوسط. على العكس ، يتم تقييم التصنيف بقياس الدقة.

اكتمل

توفر تقنية التصنيف النموذج أو الوظيفة التنبؤية التي تتنبأ بالبيانات الجديدة في فئات أو ملصقات منفصلة بمساعدة البيانات التاريخية. من ناحية أخرى ، فإن طريقة الإرجاع تقوم بنماذج دالات القيمة المستمرة ، مما يعني أنها تتوقع البيانات في البيانات العددية المستمرة.