UHGP-MC 4441

Information

Number of sequences (UHGP-50):: 101
Average sequence length:: 70±5 aa
Average transmembrane regions:
: 0.01
Low complexity (%):
: 0.3
Coiled coils (%):
: 0
Disordered domains (%):
: 1.37
Pfam dominant architecture:: PF18832
Pfam % dominant architecture:: 7426
Pfam overlap:: 0.86
Pfam overlap type:: equivalent

Downloads

Seeds:: MC4441.fasta
Seeds (0.60 cdhit):: MC4441_cdhit.fasta
MSA:: MC4441_msa.fasta
HMM model:: MC4441.hmm

Sequences list (filtered 60 P.I.)

Protein	Range	AA
GUT_GENOME161170_00320	806-879	SVITLDTTGVEIEQHEGLWHTVDKMEIENEIFYLMRHNEFGDSVAAVILNSDGELVAQELEHGFDQGAMEAIRD
GUT_GENOME239259_03366	441-506	LHSDEIEIEGYTGTWYVMDVQRVKDRDLFLLESEIYGDEAACLIVNENRNVVMDNVHNGFADYLEA
GUT_GENOME088277_03291	21-92	QITESTKGFTAEGHFGTWHSIQMQEFHNEKFFQMRHEEFGEQVADIIVNEQGQVIAEDLWHGFSPEAMKLIG
GUT_GENOME199098_01173	114-188	VTLDTKNLFIDGCAGTWMATEECVVESQRFFLMQHEVYKEKAPNVIIDASGKLVSTEIRKGLDEDARKKILDYLN
GUT_GENOME057671_01454	114-187	ISYDTADFHIEGKAGSWLAYDSIMIDGREFFLMEHTTYGAQGANVVLDADGKIVADNVFHGFDETVKQQIREYM
GUT_GENOME048741_00028	7-73	GQSLRDFCGTYELIDVAWIRGRKYVMYRSEQRPEALRLVYNVEGRLMCRTDYNDIKTAFVEELSWEM
GUT_GENOME094003_01828	459-531	VDMDTAGHTVEGHDGTWHSIEELAVHGNTYFLMESEAFGQEANMVVVDCAGKLVAEDITPAMRADVREIVAEV
GUT_GENOME059608_00351	347-413	LNDIHIDGYLGTWHEMIRVTANDEEFIVFENDEFGNQTAFVITDKDLNPITETNGDIETAIQDYLEM
GUT_GENOME271320_01407	87-162	LHSHAEHIRIAGHIGRWYVIDEGDFSPRTNKNLVRHLFLLEHESYGDEAACLIVTDEGVIVLDDVWNGFDDLREAG
GUT_GENOME272664_00907	4-65	QTDGQRFKGRRGTWYMIDMDYIHGSRYYLYESEIWGDDAAHLVINDEGRVMCETFDDLHTAV
GUT_GENOME098708_01500	413-479	IGINSSHIKVEGHIGTWYAIDSTQIEGKDYFLLEHEDYGDEAACLIATPQGEVVLDDVWNGFGDLEE
GUT_GENOME000660_02895	333-400	LTKDTVGYEIEGKDGTWEVIDYLLVEGKNYFLMEHEQYGKDVAYVVLDQKGNVLVDSTYNGFDDVVKQ
GUT_GENOME243626_00444	867-936	QQDYPLDYIEDGIVLEGINDTFYIKDRETINGIEYYLLESQREYEDVPNLIVNKAREIIDDDIINGFDEF
GUT_GENOME039439_02038	117-184	VDTKGYTIEGKKGTWQVIDYILMNERKWYLMEHEEYGPRAAYVVLSDDGAVVMNDNYNGLDAEAREKI
GUT_GENOME109627_01049	1-63	MKQIKLEGYKGTYTKIDETWYYGFKYYLFESDVYGDEAEAVVTNKDLEPITSGYDDIVTLLDD
GUT_GENOME279987_01346	118-180	VNLGSSGIAVSGHYGTWHTLESHNIQGRQFYLMESDEFGRDAANVVVDGTGKLVAEDVLTGFT
GUT_GENOME218909_01278	838-914	GLIHGDSDHIAVEGHIGTWYAIDETEIGGEKFFLLEHEEHGDMTACVAVNEQGKLVAEDLWNGFDEDFQEAVQKYLS
GUT_GENOME216553_00899	418-487	SLEGEISADSDSLIIDGYESTWYVVDTEAVDGKELFLLENEEYGDETFGIIIDKDRNVLVDEAWNGFADY
GUT_GENOME059329_00252	62-132	VSLEATGLHVEGHQGTWHSIEQKEILGHDFFLMEHDEFGSDTANIVVDDSGKLVAEDLWNGFNQDVVRMIT
GUT_GENOME004441_02258	114-188	LISMDTVDYQMEGVKGNWLAIDETKVEGNVFFLMQSEQYGANAAYIVVKDSGELVVRESSGFDDKTIEQIQRYLH
GUT_GENOME090400_00978	105-170	ISMDTKDYEVVGKKGKWRAVDTLIIDGKQYYLLEHQEYGSRVPTVILDSYGKMIAESDKGFSEEVK
GUT_GENOME098704_00816	130-188	FKSYQGTWTEFDEIIYCGEKFKIFENDKYGDNSFYVFTDEFNNPIDTTFNDLLTALEDY
GUT_GENOME106647_02744	37-100	VDEKTSGLAVEGHFGTWHTIEKVQVDGKDYFLMEHDEFGDEAAGVVVDSNGRLMAEDVTCGIEP
GUT_GENOME104454_00923	358-433	SIIDENTSGLAVAGHIGTWHTIDHKEVDGHTFWLMEHDTLGDDISCIIVDERGELALSHIYDGFDDHTVDLLRQEV
GUT_GENOME215061_00497	16-80	ELENIKIKGHTGTWYEIDRRTLYGKTFYLMESEIYGDEAPGIIIDEAHEPVIEDVFDGFDHETVS
GUT_GENOME101338_00180	330-401	INIDTRDYEIEGKVGKWQSTDELILDGNFFYLMENQKYRGDAAAVILDTYGKIIADDVMHGFDEETKQKIRD
GUT_GENOME235224_00170	135-213	LSWISDNIKIDGHEGTWYIIDEGDFQITPDVNGKPQTLTAHLFLLESRKFGDEAACLIVDKKKQIVMEDVWNGFDDLED
GUT_GENOME226447_00831	5-74	AAGNTVAYMVPNYQIDGKTGTWLPYDSEVVEGVCFFMMRNEQRKDAVSPVVVDSKGVFVTDAPNGFENVR
GUT_GENOME046050_00688	351-418	IIEEGYNIEVDGHIGTWYVIDTDMMENTKYFLLEHEEHGDSAACVIVDGDGKLVLDDVWNGFDDLKEH
GUT_GENOME130023_02380	107-181	AVIHADTVDYKIENHNGKWRSVDYLIFDGKQYFLMENQKYGKQSVAVILDQYGKLIVDYCKNGFDEDAKRKIREI
GUT_GENOME000252_02465	589-670	LDEAEVTITADTRGFEADGHAGTWHTVDEREYAGEKFFFMEHDEYGSDVAGIIVSEHGQLVAEDLWNGYDAGALEAISEYLQ
GUT_GENOME010224_02910	304-383	GALITMETENYQIDGKKGNWIATDTIIIDGKQFYLMEHQVYRDQAQGVILDAYGKMVVEECKKFDEKTKQKIHDYIQQQV
GUT_GENOME140278_00032	110-178	MEKAISMESEQIAVAQHIGTWHPIEKQEIDGRLYFLLEHDTYGDEVASVIVDEKGILYAQEVYDGFSEE
GUT_GENOME126809_00990	2-63	DKDNIKIKGHVGKWHVIDKKKHRGKTVYLLEHNTYGDMAAGLIIDENLNVILDDVWNGFLDL
GUT_GENOME015025_01586	55-120	DRFKVQRHGGTWYVIDAAYCERLETMVFLLESETYGDEAAHLIVDEDFLVILENVWNGFDDLTEAF
GUT_GENOME198843_00085	111-189	TALLTMDTEGFQMEGRKGSWMAADETIIDGKHFFLLASEKYGRSAAYAVVDDQGRKAAEDTFQGFDEETIRQIRQTISL
GUT_GENOME074587_01232	123-191	LISLATTNFQLEGKEGRWLAFDNLVVEGKEFFLMEHTTYGKNAAWVVVDGTGKLIVDQVTAGFDETVKE
GUT_GENOME045530_01629	5-69	ISLTSNNIKVSGHIGTWYVYASRVYHGRRLFLVEHETYGDHAANLILDKTGNCVMEDVWNGWEDY
GUT_GENOME094635_01159	103-179	ALVTLDTKDYRIDGMEGNWLAADEIIIDGRQFFLMEHQDYHRQTTRVILDCYGKKIMEECGNGFDQQTKEILHGYVR
GUT_GENOME169082_00781	105-179	LSVDTQNYRIDGYSGNWRVTDYIIIDGKQFYLLEHQEFREQAARIILDSYGKYVAETGIGGFDETAKQKIREHIH
GUT_GENOME133503_00170	1-59	MRLHVEGQKFHGHLGTWHVVDTEEIRGHRLYLYEREQEPDGPWIVVDSGGAILCETEYY
GUT_GENOME223479_01162	109-191	AVIDIETSNYEIKGKKGVWEACDQLLIDGEYFYLMESMTYHNDAAFAILDAYGKLIVSENLKGFDIETIAEIRKSMYERRRMI
GUT_GENOME273500_00790	575-650	VTEETKGLLVDGHFGTWHTAEARKISGKMFYRMEHDEYGNTVAGIIVDEKGKLAAEDLEHGFDEGAMEAIEEYLQE
GUT_GENOME236884_00150	37-108	VVTMDTDGLTVDGHFGTWHSIDTMQIGGKDFYLMEHDEYGDEAASIIVDATGKLVAEDLWEGFTPEIVAMIA
GUT_GENOME011297_00641	465-527	NITLDGYEDTYHVINSDIIEYEQVYLLESETRGENAPHIVINAHGEVRADDMYSLKEYKQAID
GUT_GENOME003825_00310	315-388	IDMDTKAVELEQHEGLWHTVEEVEVEKEHFYLMEHNEYGASVAPVLVNGDGKVVAQDLENGLDQEAVKAIGEYL
GUT_GENOME159334_01044	2-81	ITGESKRIKVEGHYGTWHVIDDGWYIFTPDTPEGPETITVHCFLLEHDEYGDEAASVIVTQDGRLLAENVCNGFDDLLEA