UHGP-MC 100510

Information

Number of sequences (UHGP-50):: 109
Average sequence length:: 85±5 aa
Average transmembrane regions:
: 0.01
Low complexity (%):
: 4.22
Coiled coils (%):
: 0
Disordered domains (%):
: 0.54
Pfam dominant architecture:: PF03319
Pfam % dominant architecture:: 9266
Pfam overlap:: 0.95
Pfam overlap type:: equivalent

Downloads

Seeds:: MC100510.fasta
Seeds (0.60 cdhit):: MC100510_cdhit.fasta
MSA:: MC100510_msa.fasta
HMM model:: MC100510.hmm

Sequences list (filtered 60 P.I.)

Protein	Range	AA
GUT_GENOME022033_00223	214-297	MIIGRVYGSVVSTHKLEGLVGYKFMLVQCIENKNLVDKFLVAVDGVGAGIGEDVIITTGSSARVAIGDANSPVDATIVGILDEK
GUT_GENOME261579_00880	1-88	MIVGKVTGTVVCTQKDKGLQGQKMLVVQPVNIENLKSSGGKMVALDSVGAGEGELVVVVGGSSARMAEGYSSTPVDYCIIGIVDSIEV
GUT_GENOME250828_00087	1-86	MELAKVIGQVVSTVRCPGLPYNSLLLVDLLNEKGESIGRSQVAADPIGAGEGEWVIVSRGSSARFAIDKDAPLDLVIVGIVDHVNA
GUT_GENOME165683_00521	1-84	MLVAELVDTIWATRKSEALNGVKFLLAEVKGGRRSGELLVVVDMIGAGIGDRVIVATGSAARRMMENDEMPVDAAIVGIIDENY
GUT_GENOME153011_00307	103-185	MIAARVIDNIWSTRKADCLVGIKFMIVEVIDGKDAGRRFIAADLINAGIGENVIVSQGSAARQMFEPDTMPVDAAIIGIIDEE
GUT_GENOME238250_01438	1-86	MRIAIIKGHVTATVKHPTLEGWRMLIAQPVTPDDSPDGPPQIVIDPLGAAVGQKVVINSDGAEARRLIGAKHSPARWTVLGIVDPA
GUT_GENOME176978_01959	1-87	MYLAKVTGALVSTTKHASLNGAKLLIVARLDEHYQPTGTAQVAVDFVGAGNGETVIVTTGSSARMTTSKEHSVIDAAVVGIVDSLDL
GUT_GENOME096098_00798	1-87	MFLAKIVGKIVSVTKNEGLHGKKILIAVPINMNDEVIGGEIISLDNVGAGIGDKVLIANGDVARFAFDDVKDYPIDSAIISIVDSVE
GUT_GENOME261579_00873	1-85	MYIGKVIGTVVSTCKEQNLKGLKLLIVRNLFEKDPDKSEIAVDAVGAGVGDCVLVTIDGGAARMAAGVKDAPINNAVIGIVDHPE
GUT_GENOME018630_00192	1-89	MMLGIVVGQVVATRKDENLTGCKLLIVQPCPYADEASNKMPPIVAVDTVGAGVGETVLYVRGSVAPRAMHNLDAPVDTSIVAIVDRVDR
GUT_GENOME262233_01481	1-85	MFFGKVVGTIVATRKDIHLEGRKLLIVQRTDNQGNPQGDMLVAVDYVQAGRGDFVYLAKSKDAGFPVPERNAPIDAGIVGIIDHT
GUT_GENOME232032_02115	1-89	MHLAKVIGSIVATQKIGSLTGKKLMLLRMISFDETGEEMLWGAAEVAVDLVGAGEGETVLIARGSPVRHLFPEPNHGIDLVIVGIVDSV
GUT_GENOME139234_01315	1-87	MVMGKVTGSVWATKKDEHLTGQKLLVINLIKNGKTTKDEIVATDMTGAGQGDVVLVALSASARFTLPSPDAPVDAAVVAIIDRIEIG
GUT_GENOME242963_00324	1-79	MVLAQVIGKIWATKKIKSLNSYKMLTVQEEQSGKIMTAIDTLDAGKGDRVVITRGSSAMKNEINYNLPIDATVIAIVDD
GUT_GENOME245203_01744	1-85	MIIAKVVGNLWATRKEESLVGRKLMMVQPASLEGDVQGECFVAVDTIDAGVGEMVLVAQGSSARKSLGQTDSPVDAAIVAIIDIH
GUT_GENOME123912_00895	1-86	MLVGIVVGNVWATRKEDALNGLKLMVVQRLDLAHNKLAESFVAVDCVGAGTGEKVLITTGSSARKALFNEEAPVDAAIVGILDQED
GUT_GENOME092251_00195	1-89	MTFARVVGNVVATHKKEDLRGAKLMIVQPVDNFLKDNGDEMVAIDTVGAGIGDLVLVIYEGWAARTCFPTQNPLAPIETVIAGIIDEYV
GUT_GENOME138783_01257	1-87	MEIGTVIGSVWATKKHEDIEGQKLLVINIRKTRKEGKEALIVAADTTGAGVGDVVLVCRGQAARCAAGREKIPVDAAIVGIIDSMEL
GUT_GENOME207678_01137	1-85	MHLAKVIAKVVATQKIDKLVGGKLLVIRAIDTDQNTVDNEPLYVAVDSVGAGVGDCVLVDWGGSVDNDCRMVGDMSIVGIVDRIE
GUT_GENOME062906_00176	1-90	MHLAKVVGNVVSTQKDSNLVGCKLLIIKKINENGEFEKYSSQSTAIAVDSVGAGIGETVIVTTGSTARYVYGDKLAPLDMTIVGIVDEIQ
GUT_GENOME061859_00806	1-88	MQTGRVIGSIVSTQKHESLVGLKLMIIQYVDGNQEPLPSYEVAADTVSAGIGEYVLLTRGSSARHVFGDGQDINSAVDCAIVGIIDSF
GUT_GENOME142595_02530	1-87	MQLAKIVGNAKSITKSDELYGAELLIAVPVDMETMQASGQPFLVADKLGAREGQIVVCAAVCTFQEGDAAINMVVAIPEALTWDGEK
GUT_GENOME143731_00360	1-90	MYMARVVGSVVATQKDPSLVGKKLMIVQQINSDQQPVRFEQVAADTVNAGIGDNVLIVRGAGARRADKERDEDQVRDVNDCTIVGIIDRF
GUT_GENOME044231_01100	1-86	MELGRVRGSVWCTKKSGELSGCKLLLVEGWDPLDEAGGGKLRVCADVIGAGVGEGVLVATGTAARRAIGADKAPVDAAVVAIVDGW
GUT_GENOME096561_01757	1-89	MQLARVVGSLVSTRKSDKLQGMKILVAVPVDMDTFEEKGAPFVTIDAIGAGEGEVVMCVGGSSSRQTDLTDGKPVDNTIVAIIDSVDVQ
GUT_GENOME110003_01501	156-233	MRAGLVLGAVWATKKSPALTGQSLLRVRCGETEYLAADLVGAGPGDRVILAFGAAARAGRPDVPVDAAIVAILDETEA
GUT_GENOME278799_01501	15-99	MQLAKIVGNLTMASAHESLKGNALFLCQPIDENGNDAGAVVAAISPFGGGLGSKVVIVADGSQARRYVGHEHSPLRHCIVCVLDD
GUT_GENOME026228_00020	1-86	MYTGEVVGCVVATVKDAGLANIPLLIVQLIEKGKKSKMIVAADATRQAGRGDYVYLIGSKEAGRMFRQKLTPADAAIVGFIDRYNV
GUT_GENOME018858_00964	1-89	MNLGRVVGTVVSTSKCPQLIGFKLLIVEPLDEHLQRCGKTQVAVDAVGAGKGEVVITCDGSAARHLFQDEKPDSTPIDAAIIGIVDTVE
GUT_GENOME128997_00066	1-76	MKIGVVTGSVWATKKCPALTGQAFLTVQLDTETVVAVDFVGAGRGDTVLVTLGSASSREIPAPIDASIVGILDKEE
GUT_GENOME096414_01353	544-630	MILAKVVGRVISNQKTPDLMGAKLLLVSKIDEFQNLKEGITYVAVDKVGAGQGDIVLVGDSATNERKDSYQELYQDMSIVAIVENIQ
GUT_GENOME171359_02963	1-80	MKMGKVVGNMVSSRKYDGLQGYKLLLIELCYTEPKAYIVAADTIGAGLDQLVLVAEGSNIQQALTKPAPIDALVVGIIDS
GUT_GENOME000607_01274	1-77	MFLCKVICSVISQQKEPCLTGKKLLLCETAEGRGKSRLVAVDLVGAGPGSQVLVSRRYGGSKEGDYIDDIIVGIVDE
GUT_GENOME282991_00008	1-84	MELAKIIGKVWATKKADGLDGQRFALAQFITADGALSPRTLVACDTIGAGVGDTVLVAHGHAARAVLGRDVPVDCAVIAIVDCV
GUT_GENOME072377_02216	1-85	MVVAKIVGNVVLACAHPSALRNALFLCQPLDENGDEISDPIVAISPFGGGIGSKVLVSTDGSAAREYVGDPNSPIRNSIICVIDE
GUT_GENOME238250_00547	1-93	MLIARVEGSVVATKKNDKMTGRRMVLVRPFVVSEPGATAFKPSSSTLVAYDALGAGAGELVLVVQGSSARLAAPDKDTPVDAVVIGIVDSVDC
GUT_GENOME063689_00160	1-87	MLLGKVTGSLWATRKDEKLNGSKFMLVKTWNMNLEQAEGLLVAADNAGAGVGDLVLITQGMAARISAENEGIPIDAMIVGVVDSVET
GUT_GENOME021831_00621	1-86	MRIGVVIGSVWATRKEPKLEGLKLLIVEPLDYKMAGNITREPYIAADVVDAGIGDKVLIVTGNPARYAVGTSVPIDAAIVGVIDDT
GUT_GENOME118758_00227	4-86	LMLIGKVTGTIVSTRKCESLIGSKFLEVQLIHNGVESDSYIIAIDSVGAGIGERVLLTTGSGARLALRDTNMPTDAVIVGIVD
GUT_GENOME256537_00537	1-77	MRIGKVCGSVWSTKKAEQLTGAKFLVVRFSDKTEAIATDTVGAGVGDTVLVIFGSTAKALCAMPTDAAVCGIVDRAE
GUT_GENOME103760_02541	1-91	MMIARVVGNIVATQKHGDYQGQKLLLVRAANLAGELYGPETVAVDGADTDSGIGDLVLVIQEGGSARQAARCGHNGPIDASVIAVADSIET
GUT_GENOME157967_00065	1-85	MLKGKVVGNIVSTNKFDSLRGYKFLEIRLIEQDRLTDRYIVAVDRSISAGIGEEVLVVTGSSARVAAGETDAPVDALVVGIIDKG
GUT_GENOME146009_04357	1-86	MKLAVVIGQIVCTVRHPGLESDKLLLVEMIDREGRPNGEVAVATDSIGAGNGEWVLIVSGSSARRAQHRETSPVDLSVIGIVDEAV
GUT_GENOME173859_00024	1-81	MWLGIVIGNVWCTKKVSALTGQTFLLVAPEGHQGPALVCADQAGAGPGDRVLVTRGSGARVAAGESIPVDAAVVGIVDRVE
GUT_GENOME097725_00091	1-90	MRLAKIVGVAQSLTKSDELYGTDILIAIPVEVDTLKENGASFLVMDRLGAKTGQIVICSSGSASWDGMAAGAPDERVVAIPESLEFEGKN
GUT_GENOME051534_00763	1-84	MVIGKVTGSIFSTRKTESLIGSKFMVVSLQKSGGNKPEYVVAVDNLGAGINDTVLVTMGDSARYGCPDINVPVDAVIVGIIDQS
GUT_GENOME222837_00981	1-87	MYIGKIKGVVVATTKDKELVGKKLLIVQPLDVEYNPIGNCEIAVDFVGAGTGEIVLVATGSSARQVSGSSKAPIDRSIVAIVDNIEV
GUT_GENOME096235_03752	1-93	MILAYVLGNVWSTRKEEALKGFKFLVVQPVTLTYEESGRPRFEKYGNTLIAADRIGAGETEIVMIASGSSARQSLEDQRAPIDAVVIGIIDKE
GUT_GENOME090356_01449	1-85	MQLARIIGSVVSTEKLTSLEGTKLLVMQPIDSSGKDVGSPIVGVDTVGAGTGETVFYAKSKEGAMTLADPSACADAGVVGILDYY
GUT_GENOME257519_01091	1-89	MYAARVVGTVVCTSKEEKLTGLKMLVVQPVNVLNMKNEGKCAVAIDAVGAGHNEIVLVVGGSSARQTEVTTNKPVDATIMAIVDYIEIE
GUT_GENOME264510_01033	1-85	MKICKVVGSVWATKKDVKLEGAKLMIVMPLYGSQGDPLIAADYVGAGIGERVLVITGSTARFVSAKEGAPIDASIVGIVDSIEIA
GUT_GENOME283050_02863	1-85	MQIAKVIGTVVAVQKDERLSGVRLMVIQPVDSKGNAEGKPIVAGDAIGSGIGETVIYAKSKEGAFCLPDPKACCDAGITAIVDSM
GUT_GENOME086587_03699	1-88	MKTGKVIGNIWATRKEERFSGMKLLIVQPFNPMDDTEIEYPVVASDIIGAGIGERVLYVNGSSARTAAGGQDIPVDAAVVAIIDDQEI
GUT_GENOME137256_00544	1-90	MYLGKVIGTVVSTVKNPSLTGCKFLIVEKINQDLTAKKQTEIAVDTVGAGDGETVIVVGGSSARMSGDGETKQAIPVDAAIVGIVDTVEV
GUT_GENOME096561_01756	1-89	MLIGRVKGTVVSTNKVNKLTGSKLLIVQPVDIETFEEKGEYVICIDDVGAGDGDIVMCAYGSSARQTDTSKKYASDYSIYGIVDYITIK
GUT_GENOME096235_01228	1-86	MRIGRVINSIWATRKADSLIGTKLMIVQLLDRPHGELGPIIVAADIIGAGIGEKVLVTEGSSARNMDNFNDSPIDSTIVGIIDEEK
GUT_GENOME155166_00651	1-87	MFLAKVVGKVVSTTKDEGLNGKKVLVVAPIDMDGNVISDKRVVSIDSVGAGIGDQVLVTTGSVSAYPFAENGAVAIDSAIVAIIDTI
GUT_GENOME207678_03298	1-88	MWLGKVVGTVVATPKDESLTGCKLLIVQPLRLCSNQGLSPVVAVDTIGAGTGESVLVVTGSSARHVTGNPQSAVDAAIIGIIDTIELN
GUT_GENOME005110_00363	1-88	MLICKVVGHVWATKKEEGLEGLKLMVVQEIDGTGRKKGNTFVAADVVGAGIGEQVLTVSGSTARKAFGRDTVPVDAAIVAIIDTVEVN
GUT_GENOME207289_00785	1-80	MQISRVVRDLVTTKRVFWLASKSLRVVEDPAGNLDVVVDPIGTKPGDYVITIGYSAARAAAGNPNITTDLTIGGIIDDWS
GUT_GENOME207472_01059	1-81	MKICQVEGTLVATARIPGLLNRRLLVVKERGSSAKQVAVDPVGCKPGDWVIAVGSSAARDAAGSKDFPSDLTIVGIIDYWD
GUT_GENOME066321_00489	1-94	MRIGRVIDNIWSTRKEESLRSAKLMVVQILDTPSDLENPANNGGKVQIAADIIGAGIGELVITVGGSSARRAGGYDSNVPIDLLIVGIIDENEW
GUT_GENOME096283_01816	1-85	MFIAKVIGKVVSTQKAEKLVGSKLLVIKSLNEHTKFSEEGALVAVDRVGAGMNDIVLVDWGDSLYEEAKLAADMAIVGIIDEIQL
GUT_GENOME090555_00388	4-88	MYICKVQGKCVSTIKDEHLKGCSLITMQRMNKSGGPSGEMLVAVDTIGCSVGETVLVTRGSGARAVLGADSPADMVVVGIVDTYD
GUT_GENOME141675_00262	1-82	MILAKVVGHVIATQKCDALKGSNLLILNALGDDLTPLKDRTYVAVDCVGAGQDDIVLAEKYLALNKESYKAMSIVAIVEKVY
GUT_GENOME244103_00492	1-86	MQLAQVIGTVVSTKKSDSLRGCKLMVVRIQNKDLKTFGEARVAVDTVGAGVGELVLCVSGAAARNAVAAPASPIDTAIVGIVDTID
GUT_GENOME012053_00483	1-94	MFLAKVIGQVVSTQKDSRLVGSKLAVLRPLQIGDEKSPELVETKNTVVAVDGCSAAVGQIVLYAQGSSARQAEGMKELPIDAAVIGIVDNVEAF
GUT_GENOME000153_00017	220-301	AMILGIVKGTVVATRKMPELVGYKFLLVEPVFGSKKDTIVAGDNIGAGVGEMVLVTTDETTQHGLDHPSPIDAFIVGIVDNP
GUT_GENOME097732_01144	1-78	MEIGTVTGSVWATRKARELGGHTLLVVRTDMGKLVAADFVGAGAGDRVLLVTGSTARLYCPESPVDTAIVAILDQMEV
GUT_GENOME254531_00881	1-76	MKCYEVTGMVSAEKRLSALDELSLITLRSSEGEGLVAADLLGVRPGDRVVVSTSGAQAVLGTNLPVDALVLCVLNR
GUT_GENOME006873_02034	133-209	EEMKVGKVVGAIWATRKAACLQGQTFLVVESNGEKIVAADQVGAGTGDKVLLATGTVASKYCMDAPVDAAVVAIVDE
GUT_GENOME246144_01226	1-75	MKLGVVTRQVAVKKQAACWQEEKIFLVELEGSSLAALDAAGAEPGDPVLLVMGNAAAAYCMAAPTDAVIVAVAEK
GUT_GENOME004087_00823	16-101	MRLAKIIGTVVATRKDNSLVGYKLMIIRRIDGHGNFIDSEEVAVDYVGAGIGETVLIGSGSSVRVDQSKREAVIDMAIIGIVDTMD
GUT_GENOME013238_00366	1-95	MKLARVIGRITLSKKDEALAGIRLIIASPLDKSQMTGENSSQLSANKSNLIVCDCFGAAMGDIIGYVEGAEATAPFDSPTPVDAYNVGLVENLRY
GUT_GENOME098162_01623	1-87	MYIGRVIGTVVATRKDEKLVGSKLLITQPLNIELKPIGEPLIGVDTVGAGIGELVIYVKGTASRIAARKMDSPIDISIVGIIDSMDV
GUT_GENOME105885_02766	1-85	MDIGRIVGKTVCTVKQESMGGLRLCLVQIPPEGENSRIVVAADAVQAASEGALVYLIDGSEAADAMRRGKVPVDLSVVGLVEHYG
GUT_GENOME140601_03990	1-87	MFLGKVIGSVWSTQKEAGMENLKLLIVQPIDWKETEGGQTVIAADRIGAGVGERVIVSRGSVARSLFQEKNVPVDAVIVGIVDSFEI
GUT_GENOME096439_03792	1-85	MIIGDVMGSVWATRKDEKLNGLKLLIVKPIYNDDLASTFVAADLAGAGVGDTVLVTKGSSARSAFGKERLPIDSVIVGVVDSIDM
GUT_GENOME000181_01512	1-93	MTLGKVVGHVVSTQKDAGLTGAKLLIVRCLEVNPDNSAFVESSMAMVVVDTVGAGAGETVIMTSGSNATKYVKGFEHFPTDMTIVGIVDSAEL
GUT_GENOME140566_02522	166-254	MHLARVTGAVVSTQKSPSLIGKKLLLVRRISADGELPLTPLTGDEVAVDSVGAGVGELVLLSSGSSARHVFSGPNEAIDLAVVGIVDTL
GUT_GENOME219686_02894	1-87	MRIGRVTGNMTSVIHDPSHEGYKFLTVRFVNAEGQEEDAEAVFADAAQAGIGDLVLVCEDGGAAGMVFALEGSVCVLDGVIVGVIDR
GUT_GENOME093237_00280	1-89	MRLARVVGNVVSTVKDPCYTGYKLMLVEYLDPDTRQPDGARQIVFDCVDAGVGDIVLVNIDGGAANMLLNDKVCIADQTICGIIDSYTS
GUT_GENOME096519_01143	1-88	MVIGEVVGNLWSTKKVDSLSGARFLLVNVTDQRVDNQNWQTRQIVACDIVGAGFGEKVLVVEGSGARVVEKKSRAPIDATVIGIIDSI
GUT_GENOME238250_01439	1-91	MRAGTVIGRVVCTVMHPAFRGDTFVLVLPWNTKTWKAGGKADFDNSLVAYDELGAADGQTVAFAESGEAAAALNPPKPVDAYCAMILDAVD
GUT_GENOME230525_00459	1-87	MFVGKVKGSLWATRKDENLNGLKFLVVERQLNEHQSDPALLIVADCIGAGEGDQVMVTTGSSARMSLNKTNIPVDMVVVAIIDKVDY
GUT_GENOME260354_02365	1-90	MLVGRVMGAVASSTKKTELTGMKLLMVKEIDVATLKDKSDLWIGIDTVGAGEGDIVMLVRGSSSRCLPGYKDTPADCTVVAIFDTIDIHG
GUT_GENOME122716_00453	1-79	MRLAYVVGSIWATRKSDGLCAYKLLLVRDAHDGEFYTAADTLDAGEGEMVITAGGSSAARNEDNISLPIDASIIAIVDE
GUT_GENOME145988_01223	1-93	MKLGKVIGQIVSTRKDERLVGHKLLLVQFLEPTKDGKLAIARSDGRVEVSVDLVGAGVGETVLLCSGSSARNATGVIDAPIDYAIVGIIDTVD
GUT_GENOME011747_00167	1-86	MIIGKVVGHVVSTRKNENLIGQKLLIVEPHESLKGNMGSSRFIAIDNVGAGIGETVLVATGSAARVGCDLKNAPVDAAIVGIIDCP
GUT_GENOME129090_00467	1-88	MYVCKVIGKIISTVKNEKLVGHSIVLVQAAALNDRGSLEADGPVFAAADTIGCGEGNFVLVTRGSNARYACKCAEAPVDMAVVGILDG