మింగ్కీ వు, మోనిక్ రిజ్కెల్స్ మరియు ఫేమింగ్ లియాంగ్
అధిక రిజల్యూషన్ మ్యాపింగ్ మరియు బలమైన ChIP ఎన్రిచ్మెంట్ సిగ్నల్ల కారణంగా, ChIP-seq జన్యు-వ్యాప్త ప్రోటీన్-DNA పరస్పర చర్యలను అధ్యయనం చేయడంలో ChIP-చిప్ సాంకేతికతను భర్తీ చేస్తుంది, అయితే భారీ డిజిటల్ ChIP-seq డేటా గణాంకవేత్తలకు కొత్త సవాళ్లను అందిస్తుంది. ఈ రోజు వరకు, ChIP-seq డేటా విశ్లేషణ కోసం సాహిత్యంలో ప్రతిపాదించబడిన చాలా పద్ధతులు మోడల్ ఆధారితమైనవి, అయినప్పటికీ, జీవ వ్యవస్థల సంక్లిష్టత మరియు సీక్వెన్సింగ్ ప్రక్రియలో ఉత్పన్నమయ్యే వైవిధ్యాల దృష్ట్యా, అన్ని డేటాసెట్లకు పని చేయగల ఒకే మోడల్ను కనుగొనడం అసాధ్యం. ఈ పేపర్లో, మేము ChIP-seq డేటా విశ్లేషణ కోసం MICS (ChIP-Seq కోసం మోడల్-ఫ్రీ ఇన్ఫెరెన్స్) అని పిలవబడే మోడల్-ఫ్రీ విధానాన్ని ప్రదర్శిస్తాము. ఇప్పటికే ఉన్న పద్ధతుల కంటే MICS కొన్ని ప్రయోజనాలను కలిగి ఉంది: ముందుగా, MICS డేటా పంపిణీకి సంబంధించిన ఊహలను నివారిస్తుంది మరియు డేటా కోసం మోడల్ అంచనాలు ఉల్లంఘించినప్పుడు కూడా ఇది అధిక శక్తిని నిర్వహిస్తుంది. రెండవది, తప్పుడు ఆవిష్కరణ రేటును అంచనా వేయడంలో MICS అనుకరణ-ఆధారిత పద్ధతిని ఉపయోగిస్తుంది. అనుకరణ-ఆధారిత పద్ధతి ChIP నమూనాల నుండి స్వతంత్రంగా పనిచేస్తుంది కాబట్టి, MICS వివిధ రకాల ChIP నమూనాలకు పటిష్టంగా పని చేస్తుంది; సుసంపన్నత బలహీనంగా ఉన్న ప్రాంతాలకు కూడా ఇది గరిష్ట ప్రాంతాల యొక్క ఖచ్చితమైన గుర్తింపును అందించగలదు. మూడవదిగా, MICS గణనలో చాలా ప్రభావవంతంగా ఉంటుంది, ఇది సహేతుకమైన పెద్ద డేటాసెట్ కోసం వ్యక్తిగత కంప్యూటర్లో కొన్ని సెకన్లు మాత్రమే పడుతుంది. ఈ పేపర్లో, మేము ChIP-seq డేటాను అనుకరించడానికి ఒక సాధారణ సెమీ-అనుభావిక పద్ధతిని కూడా అందిస్తున్నాము, ఇది ChIP-seq డేటా విశ్లేషణ కోసం విభిన్న విధానాల పనితీరును బాగా అంచనా వేయడానికి అనుమతిస్తుంది. MICS వాస్తవ మరియు అనుకరణ డేటాసెట్ల ఆధారంగా MACS, CCAT, PICS, BayesPeak మరియు QuESTతో సహా ఇప్పటికే ఉన్న అనేక పద్ధతులతో పోల్చబడింది. MICS ఇతరులను అధిగమించగలదని సంఖ్యా ఫలితాలు సూచిస్తున్నాయి. లభ్యత: MICS అనే R ప్యాకేజీ http://www.stat.tamu.edu/~mqwuలో అందుబాటులో ఉంది.