విమల్కుమార్ బి వాఘేలా, కల్పేష్ హెచ్ వాండ్రా మరియు నీలేష్ కె మోడీ
ఈ రోజు డేటా రిలేషన్ స్ట్రక్చర్లలో నిల్వ చేయబడుతుంది. ఈ డేటాను గని చేయడానికి సాధారణ విధానంలో, మేము తరచుగా విదేశీ కీ లింక్లను ఉపయోగించి ఒకే సంబంధాన్ని ఏర్పరచుకోవడానికి అనేక సంబంధాలలో చేరడానికి ఉపయోగిస్తాము, దీనిని ఫ్లాటెన్ అని పిలుస్తారు. ఫ్లాటెన్ సమయం తీసుకోవడం, డేటా రిడెండెన్సీ మరియు డేటాపై గణాంక వక్రీకరణ వంటి సమస్యలను కలిగిస్తుంది. అందువల్ల, అనేక సంబంధాలపై నేరుగా డేటాను ఎలా మైన్ చేయాలనే క్లిష్టమైన సమస్యలు తలెత్తుతాయి. ఇచ్చిన సమస్యకు పరిష్కారం మల్టీ-రిలేషనల్ డేటా మైనింగ్ (MRDM) అనే విధానం. ఇతర సమస్యలు అసంబద్ధం లేదా సంబంధంలో అనవసరమైన లక్షణాలు వర్గీకరణ ఖచ్చితత్వానికి సహకారం అందించకపోవచ్చు. అందువల్ల, మల్టీ-రిలేషనల్ డేటా మైనింగ్లో ఫీచర్ ఎంపిక అనేది ముఖ్యమైన డేటా ప్రీ-ప్రాసెసింగ్ దశ. డేటా మైనింగ్ కోసం సంబంధాల నుండి అసంబద్ధమైన లేదా అనవసరమైన లక్షణాలను ఫిల్టర్ చేయడం ద్వారా, మేము వర్గీకరణ ఖచ్చితత్వాన్ని మెరుగుపరుస్తాము, మంచి సమయ పనితీరును సాధిస్తాము మరియు మోడల్ల గ్రహణశీలతను మెరుగుపరుస్తాము. మేము మల్టీ-రిలేషనల్ నేవ్ బయేసియన్ క్లాసిఫైయర్ కోసం ఎంట్రోపీ ఆధారిత ఫీచర్ ఎంపిక పద్ధతిని ప్రతిపాదించాము. మేము ఇన్ఫోడిస్ట్ మరియు పియర్సన్ కోరిలేషన్ పారామీటర్లను ఉపయోగిస్తాము, ఇది బహుళ-సంబంధిత డేటాబేస్ నుండి అసంబద్ధమైన మరియు అనవసరమైన లక్షణాలను ఫిల్టర్ చేయడానికి ఉపయోగించబడుతుంది మరియు వర్గీకరణ ఖచ్చితత్వాన్ని మెరుగుపరుస్తుంది. మేము PKDD ఆర్థిక డేటాసెట్పై మా అల్గారిథమ్ను విశ్లేషించాము మరియు ఇప్పటికే ఉన్న ఫీచర్ల ఎంపిక పద్ధతులతో పోల్చితే మెరుగైన ఖచ్చితత్వాన్ని సాధించాము.