نُونِيَّةُ ذَرْفُ العَبَرَات
نُونِيَّةُ ذَرْفُ العَبَرَات
على مَنْ ظَنَّ "التّعَرّفَ على الأَنْماطِ" بِغَيْر عُلْومِ الرياضيات
مقدمة
لمحبى اللغة العربية والشعر والتعرف على الأنماط معا! أكتب هذه القصيدة. ولقد كتبتها على وزن بحر الوافر الجميل
مُفَاْعَلَتُنْ مُفَاْعَلَتُنْ فَعُوْلُنْ *** مُفَاْعَلَتُنْ مُفَاْعَلَتُنْ فَعُوْلُنْ
وهو نفس البحر الذى نظم عليه عمرو بن كلثوم معلقته الشهيره فى الفخر والهجاء والتى درسناها جميعا فى المرحلة الثانوية. ولذلك قد تبدو أبيات القصيدة متأثرة كذلك بهذه الألوان الأدبية. وقد حاولت وزن الأبيات على البحر على قدر الوقت المتاح. ولا أحسب أن هناك الكثير من الكسور فى الأوزان. هذه القصيدة فيها من معان جادة كثيرة:
منها سرد الملامح العامة العريضة لعلم "التعرف على الأنماط" والتى يخطئ فيها الكثيرون، ممن ينسبون أنفسهم لهذا العلم. ومنها أهمية دراسة أى علم دراسة مؤصلة على أسس. ومنها أهمية التحرى فى أخذ العلم من مصادره.
أكتب هذه المعانى وأنا فى قمة التمنى لأن تتوفر لى الأوقات لأن أتعلم المزيد من علوم الرياضيات وفروعها التى لم أعلمها بعد كى أضرب بجذور أكثر ثباتا فى بطون العلم والتخصص. ولكن للأسف فما نجهله أعظم من أن يحصى والوقت أسرع من أن يحسب "واتقوا الله ويعلمكم الله".
وبالرغم من هذه المعانى الجادة فى القصيدة إلا أن نَظْمَ عِلْمٍ مثل "التعرف على الأنماط" بقافية شعرية عربية، وهو أمر غير معتاد، يضفى روحا من المرح على جو القصيدة. ولأن هذا الفن جديد ولأن الكثير من المصطلحات المستخدمة هى بالأصل إنجليزية ثم عربتها لتناسب النَظْم، فلذلك أردفت شرح كل بيت من أبيات القصيدة العربية بجملة من اللغة الإنجليزية! (ولعلها من عجائب آخر الزمان)
التجربة الشعرية (الدافع وراء القصيدة)
- الحب للغة والتعلق بالشعر وبخاصة الشعر العربى الأصيل لما فيه من قوة البيان.
- الإعجاب بفصاحة الشعراء والقدرة العجيبة على نظم علوم بأكملها على هيئة أبيات موزونة.
- الحب الشديد للتعرف على الأنماط وتخصصى فى هذا المجال.
- الرغبة فى أن يتعلم أصول هذا العلم كل من ينسبون أنفسهم له. فللأسف نرى من البعض منهم الكثير من الأخطاء الفادحة الناتجة من عدم فهم أصول هذا المجال وذلك لعدم دراستهم لها (وليس مجرد الأخطاء العابرة والتى قد تسهو على أى إنسان). نرى هذه الأخطاء من بعضهم ومن بعض طلابهم مما يساهمون به فى إضعاف هذا المجال وتطبيقاته واستنتاجاته!
- تشجيع البعض لى على نظم هذه القصيدة.
والآن إلى القصيدة
تَعرّفُهُم على الأنماط حائِرٍْ | وَهُمْ ليسوا بِثَبْتِ العَالمينا | |
ظنّوا العِلْمَ إِرْثَ مَنْ اِدّعاهُ | صِياحٌ فى دُروبِ العَابثينا | |
جَرائِدُ عِلمِ قومٍ شِيصُ نَخلٍ | عُلُومُهُمُ سراب الباحثينا | |
فَأَيْنَ سِنينَ أَرْحَلُ فِى سُرَاها | إِلى عِلْمٍ يَسَارًا أَوْ يَمِينَا | |
أَلا اَعْطُونِى بَيَانَاتٍ سَئِمْتُم | لَهُنّ مُصَنِّفًا فَلَقَدْ بَنِينَا | |
بياناتٍ رَسَمْناها فَكُنّ | بصائَرَنا تُخَبّرُنا اليَقينا | |
فَرُبّ مُُصَنِّفاتٍ قَد أَبَيْنَ | وَمَا نامت عُيونُ النَاظرينا | |
فَإنْ زَاغَتْ عُيُونُ الثّبْتِ عَنها | فَحتْمًا قَدْ حَذِرْنا وَقَدْ بُلِينا | |
فَما لَكَ عَنْ تَدَرُّبِ واختِبارٍ | وخَفْضِ العَرْضِ لَوْذٌ فَاسْمَعونا | |
بياناتٌ صُفُوفُها إِسْتَطالت | فَذَلِكَ مِنْ عُلومِ الأوّلينا | |
وَإِِنْ زَادَتْ عُروضًا لَنْ تَرَاهَا | سِوَى مَكْرًا يُحِيرُ البَاحثينا | |
فَخْفضُ العَرْضِ كان لنا لِزامًا | وفِيه هَوى حِرَاكُ الرَّافِدينا | |
بياناتٍ يَخِفُّوا العَرْضَ منها | فَمَا خَفَضُوهُ قَبْلُ ومَا رَضينا | |
فَما خَفَضُوهُ إلاّ قَبْلَ قَسْمٍ! | رَمُوا عُشْرًا وتِسْعًا قَد بَقِينَا | |
فَأَيْقَنّا مُصَنّفَهُم سَرابَا | وَلاَحَ لَهم مُصَنّفُهم يَقِينا | |
فَتِلك مُصَنّفاتٌّ لو تُعَالِجْ | بَيَاناتٍ قَدِمْنَ لَكُنَّ شِينَا | |
بياناتٌ فَريضَتُها التّقْسيمُ | لِخَفْضِ العَرْضِ نَسَاه الأكْثَرونا | |
فُنونُ العِلْمِ يُعْطيها الإلَه | لَمَن سَهَرَ الليالىَ والسِّنينا | |
وَصَبرُ الدارسين لِمَنْ يُعَلِّمْ | يُزِدْ بَأْسَ الحَدِيدِ فَلَنْ يَلِينا | |
عُلومٌ قَد حَواها أَهْلُ إحْصَا | فَهَذا لنا سلاحٌ دام فينا | |
فِرِدْمَنْ هِسْتِ إِفْرُنْ تِبْشِرَانِى | هُمُ عَلَمٌ وَكُلاً قَد لَقِينَا | |
فلا تَبْنِ البُيوتَ مِن التُّرابِ | فَأَولُ سَاكِنيها لآَخِرُونا | |
ولا تَسْقِ العُلومَ مِنَ السَّرابِ | فَتَعْلَمَ مِن عُلُومِ الجَاهلينا |
شرح القصيدة
تَعرّفُهُم على الأنماط حائِرٍْ *** وَهُمْ ليسوا بِثَبْتِ العَالمينا
Unfortunately, some approach pattern recognition in a misguided way. This stems from the fact that the majority working in this field have not studied the proper mathematical foundations
ظنّوا العِلْمَ إِرْثَ مَنْ اِدّعاهُ *** صِياحٌ فى دُروبِ العَابثينا
Claiming ``science'' is nonsense science has measures
جَرائِدُ عِلمِ قومٍ شِيصُ نَخلٍ *** عُلُومُهُمُ سراب الباحثينا
Therefore, their publication record lacks rigor, and the majority of their researchers cannot benefit scientifically from it
فَأَيْنَ سِنينَ أَرْحَلُ فِى سُرَاها *** إِلى عِلْمٍ يَسَارًا أَوْ يَمِينَا
I wish I could spend more years studying as a full-time student to deepen my knowledge in many pattern-recognition-related fields, such as group theory, functional analysis, among others
أَلا اَعْطُونِى بَيَانَاتٍ سَئِمْتُم *** لَهُنّ مُصَنِّفًا فَلَقَدْ بَنِينَا
Now suppose you have a dataset that is so difficult for you to classify, and I will illustrate the fundamental steps of Pattern Recognition
بياناتٍ رَسَمْناها فَكُنّ *** بصائَرَنا تُخَبّرُنا اليَقينا
Data visualization prior to analysis is extremely important; it provides a lot of insight and shortcuts
فَرُبّ مُُصَنِّفاتٍ قَد أَبَيْنَ *** وَمَا نامت عُيونُ النَاظرينا
It happens in many cases that analysis and classification are extremely difficult, even in lower dimensions. However, data visualization using advanced techniques, such as parallel coordinates, sometimes tells you the right classifier
فَإنْ زَاغَتْ عُيُونُ الثّبْتِ عَنها *** فَحتْمًا قَدْ حَذِرْنا وَقَدْ بُلِينا
If it is still difficult to observe a pattern, it seems that this is a challenging problem and you have to be cautious
فَما لَكَ عَنْ تَدَرُّبِ واختِبارٍ *** وخَفْضِ العَرْضِ لَوْذٌ فَاسْمَعونا
In such cases, there is no alternative to methods such as dimensionality reduction, training, and testing, among others. So, please pay attention to the sequel
بياناتٌ صُفُوفُها إِسْتَطالت *** فَذَلِكَ مِنْ عُلومِ الأوّلينا
When datasets are long and thin, this is something fundamental, and many classical methods will work without worrying about classifier instability
وَإِِنْ زَادَتْ عُروضًا لَنْ تَرَاهَا *** سِوَى مَكْرًا يُحِيرُ البَاحثينا
However, when dimensions increase, i.e., datasets are short and thick, this definitely becomes the source of all tricks, especially for practitioners and young researchers
فَخْفضُ العَرْضِ كان لنا لِزامًا *** وفِيه هَوى حِرَاكُ الرَّافِدينا
It is almost necessary in many cases to reduce dimensionality; however, a very common mistake is committed in this regard
بياناتٍ يَخِفُّوا العَرْضَ منها *** فَمَا خَفَضُوهُ قَبْلُ ومَا رَضينا
The very common, silly, and serious mistake is reducing dimensions from the whole dataset while excluding this step from data partitioning and resampling; this is a very painful mistake
فَما خَفَضُوهُ إلاّ قَبْلَ قَسْمٍ! *** رَمُوا عُشْرًا وتِسْعًا قَد بَقِينَا
A pitfall: they always partition data and perform resampling for training and testing after dimensionality reduction; for example, the regular 10-fold cross-validation: 9 folds for training and the tenth for testing
فَأَيْقَنّا مُصَنّفَهُم سَرابَا *** وَلاَحَ لَهم مُصَنّفُهم يَقِينا
Absolutely, the resulting classifier is almost a fluke, even though it shows high accuracy on the current dataset; meanwhile, the practitioners will be fooled
فَتِلك مُصَنّفاتٌّ لو تُعَالِجْ *** بَيَاناتٍ قَدِمْنَ لَكُنَّ شِينَا
Indeed, if a new dataset (not seen by this classifier before) is used for testing, the accuracy will almost certainly be poor (technically speaking: very high error rate or very low AUC value)
بياناتٌ فَريضَتُها التّقْسيمُ *** لِخَفْضِ العَرْضِ نَسَاه الأكْثَرونا
You MUST include the dimensionality reduction step in the resampling mechanism as if it is part of the training phase (and it is indeed a part of it). Many researchers and practitioners are unaware of this
فُنونُ العِلْمِ يُعْطيها الإلَه *** لَمَن سَهَرَ الليالىَ والسِّنينا
The various tricks in this field require years of hard work to master. This should be supported by a rigorous mathematical foundation
وَصَبرُ البَاحِثينَ لِمَنْ يُعَلّمْ *** يُزِدْ بَأْسَ الحَدِيدِ فَلَنْ يَلِينا
Patience and persistence in learning from experienced supervisors and mentors are key to building strong foundations and rigor for researchers
عُلومٌ قَد حَواها أَهْلُ إحْصَا *** فَهَذا لنا سلاحٌ دام فينا
statisticians know these tricks well studying Mathematics, especially Statistics, helps avoid such mistakes
فِرِدْمَنْ هِسْتِ إِفْرُنْ تِبْشِرَانِى *** هُمُ عَلَمٌ وَكُلاً قَد لَقِينَا
To mention some of those great statisticians: Jerome Friedman, Trevor Hastie, Bradley Efron, and Robert Tibshirani, the giants of Stanford University, are highly esteemed in this field. Fortunately, I had the privilege of personal communication and meetings with all of them and enjoyed many discussions with each one
فلا تَبْنِ البُيوتَ مِن التُّرابِ *** فَأَولُ سَاكِنيها لآَخِرُونا
To recap, don't build your house from dust; it will collapse after the first resident, who will also be the last
ولا تَسْقِ العُلومَ مِنَ السَّرابِ *** فَتَعْلَمَ مِن عُلُومِ الجَاهلينا
And just as acquiring water from a mirage will give you nothing, acquiring science from weak, non-rigorous sources will degrade your scientific quality