"တချို့က မွေးရာပါ ထူးချွန်ကြတယ်၊
တချို့က ထူးချွန်မှုကို ဖန်တီးပြီး
အခြားသူတွေက စိုင်ကော်လို့ ချုံပေါ် ရောက်
ကြတယ်"လို့ ရှိတ်စပီးယားက ဆိုထားတယ်။
ဒါမှမဟုတ် သူ ဖြစ်ခဲ့လား။
ရှိတ်စပီးယားဟာ သူ့အမည်ပါရှိတဲ့
လက်ရာတွေကို တကယ်ရေးခဲ့သလား၊
(သို့) ရှိတောင်ရှိခဲ့လို့လားဆိုပြီး
တချို့က မေးခွန်းထုတ်တယ်။
ရှိတ်စပီးယားဟာ အခြား စာရေးဆရာ
တစ်ယောက်(သို့) စာရေးဆရာ တစ်စုအတွက်
ကလောင်ခွဲလို့ ထင်ကြေးပေးတယ်။
ရှိတ်စပီးယားအစစ်အတွက် တင်ပြတဲ့
အမည်စာရင်းမှာ
နာမည်ကျော် ပြဇာတ်ဆရာတွေ၊ နိုင်ငံရေးသမား
တွေနဲ့ ထင်ရှားတဲ့ အမျိုးသမီးတွေတောင်ပါတယ်။
အင်္ဂလိပ်စာပေမှာ အကြီးကျယ်ဆုံး
စာရေးဆရာကြီးဟာ သူ့ပြဇာတ်တွေအတိုင်းပဲ
စိတ်ကူးယဉ်ဆန်ခဲ့တာက မှန်နိုင်လား။
ရှိတ်စပီးယား ပညာရှင် အများစုက
သမိုင်းနဲ့ အတ္ထုပ္ပတ္တိဆိုင်ရာ
အထောက်အထားကို အခြေခံပြီး
ဒီအဆိုတွေကို ပယ်ချခဲ့တယ်။
ဒါပေမဲ့ ရှိတ်စပီးယားရဲ့နာမည်ကျော်
စာကြောင်းတွေကို အခြားတစ်ဦးက ရေးခဲ့လားဆိုတာ
စစ်ဆေးဖို့ အခြားနည်းလမ်းတစ်ခုရှိပါတယ်။
Linguistics ဘာသာစကားလေ့လာမှုက
ဝါကျဖွဲ့ထုံး၊ သဒ္ဒါဝေါဟာရတ္ထနဲ့
ဝေါဟာရတို့ကို စစ်ဆေးရင်း
ကျွန်ုပ်တို့ ပြောဆို၊ ရေးသားပုံအကြောင်း
အများကြီး ပြောပြနိုင်ပါတယ်။
၁၈၀၀ နှောင်းပိုင်းမှာ
Wincenty Lutosławski လို့ခေါ်တဲ့ ပိုလန်သား
ဒဿနပညာရှင်က stylometry လို့ခေါ်တဲ့
နည်းစနစ်တစ်ခုကို
တရားဝင်ဖြစ်စေခဲ့တယ်။
စာပေလက်ရာရှင် မေးခွန်းတွေကို လေ့လာဖို့
ဒီအသိသုတကို အသုံးချခြင်းပါ။
ဒီတော့ stylometry က ဘယ်လို လုပ်ဆောင်လဲ။
သဘော သဘာဝကတော့ စာရေးဆရာတိုင်းရဲ့ဟန်မှာ
လက်ရာတစ်ခုချင်းကြားမှာ
အတော်လေးတူညီနေတဲ့ ပင်ကိုလက္ခဏာ
တချို့ ကျန်ရှိနေတယ်ဆိုတာပါ။
ပင်ကိုလက္ခဏာ နမူနာတွေမှာ
ပျမ်းမျှ ဝါကျ အရှည်၊
စကားလုံး စီစဉ်မှုနဲ့ အထူး စကားလုံးရဲ့
တစ်လုံးရဲ့ ပါဝင်မှုအရေအတွက်တောင် ပါဝင်တယ်။
thee ဆိုတဲ့ စကား သေုံးကို ကြည့်ပြီး ပမာဏ
(သို့) ဝင်ရိုးတစ်ခုအဖြစ် မြင်ကြည့်ရအောင်။
ရှိတ်စပီးယားရဲ့ လက်ရာတွေတိုင်းကို
ဒီစကားလုံး ပါရှိမှု
အရေအတွက်ကို အခြေခံထားတဲ့ ဒေတာ
အမှတ်တစ်ခုလို ဒီဝင်ရိုးမှာ ထားနိုင်တယ်။
ကိန်းဂဏန်းတွအရ ဒီအမှတ်တွေရဲ့
ကျပ်ခဲမှုက
ဒေတာအတွက် ခန့်မှန်း အစဉ်၊
ကွဲလွဲချက်လို့ သိကြတာကို ပေးတယ်။
ဒါပေမဲ့ ဒါက အင်မတန်မြင့်တဲ့ ပမာဏပြနေရာလပ်
တစ်ခုထဲက တစ်ခုတည်းသော ပင်ကိုလက္ခဏာတစ်ခုပါ။
Principal Component Analysis
လို့ခေါ်တဲ့ စုပြုံပေးတဲ့ ကိရိယာတစ်ခုနဲ့ဆို
ပမာဏအစုံပါတဲ့ နေရာလပ်ကို ရှိတ်စပီးယား
လက်ရာတွေထဲက ကွဲလွဲချက်ကို
တစ်စုတည်း တိုင်းတာပေးတဲ့ ရိုးရိုး ပင်မ
အစိတ်အပိုင်းတွေအဖြစ်လျှော့ချလို့ရတယ်။
ဒီနောက်မှာ ဒီပင်မ အစိတ်အပိုင်းတွေနဲ့
ယှဉ်ကာ
အမည်စာရင်းရှင်တွေရဲ့လက်ရာတွေကို
စမ်းသပ်နိုင်ပါတယ်။
ဥပမာ အနေနဲ့
ဖရန်စစ် ဘေကွန်ရဲ့ လက်ရာတွေဟာ ရှိတ်စပီးယား
ကွဲလွဲချက်ထဲမှာ ရောက်သွားလောက်ရင်
ဖရန်စစ် ဘေကွန်နဲ့ ရှိတ်စပီးယားဟာ
တကယ့် တစ်ယောက်တည်းဖြစ်တယ်ဆိုတာ
အတော် ခိုင်မာတဲ့ အထောက်အထားဖြစ်လိမ့်မယ်။
ရလဒ်တွေက ဘာကို ပြသခဲ့လဲ။
ကောင်းပြီ၊ ဒါကို လုပ်ဆောင်တဲ့ stylometry
ပညာရှင်တွေ ကောက်ချက်ချထားတာက
ရှိတ်စပီးယားဟာ အခြားသူမဟုတ်
ရှိတ်စပီးယားပဲ ဖြစ်တယ်ဆိုတာပါ။
ကဗျာစာဆိုကြီးက ကဗျာစာဆိုပါ။
အရေးဆိုသူတွေရဲ့ လက်ရာတွေဟာ ရှိတ်စပီးယားရဲ့
ကိုယ်ပိုင် လက္ခဏာနဲ့ကိုက်ညီမှုကို မရှိပါ။
သို့ပေမည့် ကျွန်ုပ်တို့ရဲ့ သတ္တိပြောင်တဲ့
စာရင်းအင်း ပညာရှိတွေကတော့
ပူးပေါင်းမှုတွေရဲ့ လက်ခံရမည်ဖြစ်တဲ့
အထောက်အထားတချို့ကို တွေ့ခဲ့တယ်။
ဥပမာအားဖြင့် မကြာခင်က လေ့လာမှုတစ်ခုက
ရှိတ်စပီးယားဟာ Henry VI မှာ အပိုင်းတစ်နဲ့
နှစ်ကို ပြဇာတ်ဆရာ ခရစ်စတိုဗာ မာလိုးနဲ့
တွဲဖက်ရေးခဲ့တယ်လို့ ကောက်ချက်ချခဲ့တယ်။
ရှိတ်စပီးယား ကိုယ်ပိုင်လက္ခဏာဟာ stylometry
ဖြေရှင်းနိုင်တဲ့ ပုစ္ဆာများစွာထဲက တစ်ခုပဲ။
လက်ရာတစ်ခု ရေးသားတဲ့အခါ
ရှေးဟောင်း စာတစ်ပိုဒ်ဟာ အတုလား၊
ကျောင်သားတစ်ယောက်ဟာ ခိုးကူးတာလား၊
(သို့) သင် လက်ခံရရှိတဲ့ အီးမေးလ်ဟာ
အထူးဦးစားပေ(သို့) အနှောက်အယှက်လားဆို
တာကို ဒါက ကူညီဆုံးဖြစ်ပေးနိုင်ပါတယ်။
ရှိတ်စပီးယား စာကြောင်းတွေရဲ့
ထာဝရ ကဗျာစာပေဟာ
ကိန်းဂဏန်းတွေ၊ စာရင်းဇယားတွေအဖြစ်
အကျဉ်းချုံးလိုက်တာလား။
လုံးဝ မဟုတ်ပါ။
Stylometric စိစစ်မှုတွေက ရှိတ်စပီးယား
လက်ရာတွေကို တည်ဆောက်ပုံအရ ထင်ရှားစေတာကို
ပြနိုင်ပေမဲ့
၎င်းတို့က ဖော်ပြတဲ့ သဘောထား
တွေ၊စိတ်ခံစားမှုတွေရဲ့ အလှအပ(သို့)
ဘာကြောင့် ဒီနည်းနဲ့ လူတွေကို ထိခိုက်စေ
တာကို ဖမ်းမယူနိုင်ဘူး။
အနည်းဆုံးတော့ မဖြစ်မသေးဘူးလေ။