అహ్మద్ మాలేకి*, వాహిద్ వజీనియా మరియు అయదా ఫెక్రి
ప్రమోటర్ అనేది జన్యువుకు ముందు వచ్చే DNA శ్రేణిలో ఒక భాగం మరియు జన్యువుల నియంత్రకంగా కీలకం. ప్రమోటర్ ప్రిడిక్షన్ జన్యు స్థానాన్ని గుర్తించడంలో మరియు జన్యు వ్యక్తీకరణను విశ్లేషించడంలో సహాయపడుతుంది. అందువల్ల, బయోఇన్ఫర్మేటిక్స్ రంగంలో దీనికి చాలా ప్రాముఖ్యత ఉంది. బయోఇన్ఫర్మేటిక్స్ పరిశోధనలో, బయోలాజికల్ డేటాబేస్ల నుండి కొత్త అర్థవంతమైన జ్ఞానాన్ని కనుగొనడానికి అనేక మెషిన్ లెర్నింగ్ విధానాలు వర్తించబడతాయి. ఈ అధ్యయనంలో, ప్రమోటర్ గుర్తింపును నిర్వహించడానికి రెండు అభ్యాస విధానాలు, ఎక్స్పెక్టేషన్ మాగ్జిమైజేషన్ క్లస్టరింగ్ మరియు సపోర్ట్ వెక్టర్ మెషిన్ క్లాసిఫైయర్ (EMSVM) ఉపయోగించబడతాయి. మొదటి దశలో ప్రమోటర్లు మరియు నాన్-ప్రమోటర్ల కార్యాచరణ వంటి సారూప్యత మరియు అసమానంగా ప్రవర్తించే నమూనాల సమూహాలను గుర్తించడానికి ఎక్స్పెక్టేషన్ మాగ్జిమైజేషన్ (EM) అల్గోరిథం ఉపయోగించబడుతుంది, అయితే వర్గీకరించడానికి సపోర్ట్ వెక్టర్ మెషీన్ (SVM) రెండవ దశలో ఉపయోగించబడుతుంది. మొత్తం డేటా సరైన తరగతి వర్గంలోకి. మేము ఈ పద్ధతిని σ24, σ32, σ38, σ70 ప్రమోటర్లకు సంబంధించిన డేటాసెట్లకు వర్తింపజేసాము మరియు దాని ప్రభావం వివిధ ప్రమోటర్ ప్రాంతాల పరిధిలో ప్రదర్శించబడింది. ఇంకా, ప్రతిపాదిత అల్గోరిథం యొక్క సరైన పనితీరును సూచించడానికి ఇతర వర్గీకరణ అల్గారిథమ్లతో పోల్చబడింది. EMSVM ఇతర పద్ధతుల కంటే మెరుగ్గా పనిచేస్తుందని పరీక్ష ఫలితాలు చూపిస్తున్నాయి.