UHGP-MC 69879


Information


Number of sequences (UHGP-50):
227
Average sequence length:
101±9 aa
Average transmembrane regions:
0.04
Low complexity (%):
16.25
Coiled coils (%):
0
Disordered domains (%):
3.86

Pfam dominant architecture:
PF17963
Pfam % dominant architecture:
8238
Pfam overlap:
0.09
Pfam overlap type:
shifted

Downloads

Seeds:
MC69879.fasta
Seeds (0.60 cdhit):
MC69879_cdhit.fasta
MSA:
MC69879_msa.fasta
HMM model:
MC69879.hmm

Sequences list (filtered 60 P.I.)

Protein Range AA
GUT_GENOME147802_025451356-1455SGNVLSNDVSGADVDMTVVGAASGNHVSSGVSGSVGSMIAGLYGNLILLADGSYTYQVTANASSIPNDAIEIFTYTMKDGDGDTSTALLSINVNRVTMAD
GUT_GENOME147144_02635408-532NVVLTDLDGDTTSAGLDVVVLDDVPTAVSDVNLTAASENNLILNGNVITNDVQGADGAAVTAGTLSGTYGSLVLNANGTYTYTLNPNDGDFKALTGGGVGSEVFTYTLTDADGDVSTATLTLTIK
GUT_GENOME147141_02969214-351DNINDLDATLQATVPPPATGNVITDVDGSAGVDVAGADGPMTVVQISFTVTNPAVYAGVADSINGNVVTFLVQGGTTGPIPTPAGGRLTVNADGSYSYSPPNDVAAHTQEVFTYTIVDSDGDTSSAQLKILVLDTSPI
GUT_GENOME143711_030982250-2362LNLLGGYTITYLADYTYRVDSLSAAASGNVLSNDAGIAATGAHVTQVNGVTVAGSGTTSIVGKFGTLVIDANGNYTYTLKSGVSAGSITSPDSFIYTITAQNGTQASATLNIQ
GUT_GENOME035316_00625227-306NGLTYSATTLNGLYGTFTLNANGSYTYTLNNNLGAVQGLTTGETLLDVLPYKVTNILGAALNGSYAVTIHGTNDAPTMSL
GUT_GENOME124458_001495718-5844GTTANILTLTINGTNDAPSVGASTGIMVKTDATLSGRLVTPTDPDNDLDHIVSDTLTFTPKGNELGSYGRLTLNADGTYVYTLNTGLLAVVGLLLNQKLTDTFTYTVTDGHGGTASNTLTITIKGGL
GUT_GENOME120820_007361415-1544VQASDDDRENGAGQETTDGDNHGLQFSLQGTGYDPALTSSSVWKDSSGHDPRTGPVEVSRSGDGGYVATTEYGTLTLDQYGNYTYELHKGDDDVTALGKGESVTETFVVRVVDDRGAWSEKTITITIEGT
GUT_GENOME080362_02655342-461SLIVQIIDHTPTAVNDTASMVKSVGTVSGNVYTNDKIGADGAAVAGPVTAITGGTVGNALSGTYGSITLNADGSYTYTVNSANAAVIALTAGSALTETFTYTITDADGDTDTATLTITIN
GUT_GENOME262235_00354534-662STANATTGNVITSGTPDSDVDHDAVITVKDIKLSTETSSTSVNADGETVINGKYGSLTIKADGSYTYTLDNSRTETQALAKDQTTTEVFDVTIKDELGATDTSKLTIYIKGTNDAPTSADNYGSVVEDH
GUT_GENOME130093_03329819-910VANDDTGVTEQDKPVSGNLLTNDFDPDGDNLIINTTPTTPPSHGTVTISSDGTYIYTPESGFKGVDTFVYEVCDDGDPATCDRATVTITVLP
GUT_GENOME243444_00735342-450KLSISDDHPTASPDTATAQDGGPAVTVLTGNVASVIGNDLSGADTPINVTAVVATSNGNLAGTVGTALTGEFGKLTLNADGTFSYTANHNVLVGSKDVFTYTVTDDDGT
GUT_GENOME176629_026315625-5718TGNLLANDTSSVAGTIPAGTQVTTVGSSAIAATGNTVINTTYGTLTIDARGNYTYALKAGLDADTVPATDVFSYSVRDASGTVTTATLTVGLHN
GUT_GENOME257704_043741453-1578SGNLLANDLPVSADGTVRITQVSIGGETFAVDANGNLTNLNPSASHATGSYNASSGLLTISTDNGTLTLYLKDGGGHHAGDYTYAVKASVSFPESGQISESFQYTIVDGDGDTASANLDICVKYGA
GUT_GENOME253397_00266312-404MIEGNVLKNDKTGADGLPNAVTSVKHGDEESMAGSALKGAYGELTLNADGTYTYKLDKNVDVEKGTSVTETFTYTITDADGDTSEATLTITIR
GUT_GENOME147142_028801791-1891TGNVLANDLAGADGGLSVIGYGVGSSSTTYTNGAGTQVVGLYGVLTILANGAYTYQVTKNGSQIPADAREVFSYSVRDGDGDTTNSTLTISVNPVDSNGVP
GUT_GENOME257704_024613127-3227TGNVLDNDSDVDGVQYGETRQVIFFSGENGQQAQAGQRLAGRYGVLLLNADGSYRYEVNNADPVVQALRTAGETLREVFTYRMRDTAGATSDARLTVTIQG
GUT_GENOME124021_000673350-3489GAQTTNPSELQISIQGTNDAPVITSAAPTLNLTEPSEGAEGTAQATGRIEFTDADKKADGSFHDTHTFSVKREGAEGNGGPSAEGKYGTLTIDEQGNYEYILTSDALGEGEKATETFTVTVDDGMGGTATQTITVNLTGT
GUT_GENOME187556_01604298-430INASGTECDLSLAITIEDSVPVAHADRLELETDRKAEGNLLSNDEESADGDTVVHSVTFNDTTEIFDSENNSITLDGRYGSLTVSADGKYTYTLKDDMKIPEAGTVSETFSYDIIDGDGDVSTASATLTILIG
GUT_GENOME062832_010911984-2077ESASGNVITNDHPNQGDFITLIQNSEGVQKVVLSDNTDVTLAGKYGTLTIKADGTYTYNAYGDATSAGKTDVFTYTLSNGISSDQATLTINIAD
GUT_GENOME000617_017713767-3875AIEGNVLDTTASGDMQDSGQGISVTSAVSDSVDGSTPVNVTSAGVDITGAYGVLTIHSDGSYSYQLTKGGAAIGKSDVFSYTITDEAGNTSTTNLTINIGGNIEPAQAN
GUT_GENOME249374_007601852-1942EGNALKNSVKGDGTHTFAWGNETAQYGTMTKNANGTYTYVLDNTKEAVRELNAGDTLTETFTFSYTDKDGDKATGRVIITIYGVDDYTVIY
GUT_GENOME016337_00541966-1094PHIIEVNVTIQDSLPEAKNDSIELQERGEKDVDAQGNVLDNDTLSADDATLVTVVKPADGEPVVLENGKAVINGKLGTLTINADGTYTYKLYDDTIIPDSAIVREEFTYTIMDADGDTSTAAALTILVG
GUT_GENOME103696_024721238-1382NSEPVLKTDLVTLTEDNGKLDGTHPPVSKAGNIFTNDTDPDFNGKDHWNAASAKESTADSDTQVATGGSNITGKYGTLHLNSNGSYTYTLSNESEPIQSLGHNSSLQEKFTVTVKDGDFSKTEYLIITIKGTNDTPVISVPMGEI
GUT_GENOME145593_016132000-2096IAGNVLTADAGGDVADTGDGITVSKIASSVQTTPLDVTSEGVVINGLYGQLTIHADGSYTYKATGDADAVGQADVFTYTIVDENGDMATATLTINIV
GUT_GENOME257704_056862215-2330NQAPVTAPDTATVIEDRKLLAWGNVLANDRDPEGKRLRVADPGIRRGEYGVLTLLSNGTYAYVLDDCSSKVQGLGAGETVTETFNYLASDGTQRSNGALTVTVQGTNDMPDLVRCL
GUT_GENOME032210_00247546-644LTEAQAQAGGSGENVLSNDVFGADAPADKTVTSIDGGTLGQPVSGKHGELTLNADGSYSYKLNAGVDVPKGESVTEEFTYTIKDADDDTSEATLTITIR
GUT_GENOME146009_036692421-2530KDVSYLVTTESGSVSGNVIAGDSAGGEMDTLPSGSVLSSVNGIAVSSTGSTVIQGEFGTLTINANGAYTYALNAGQSLSTVGQSETFTYTVKAPDGTLASATLTVNLQHP
GUT_GENOME141307_005531534-1664ITGNVLSNDTAAPIGLDLSIVSIKETTAGVDETVVSGTPKVIEGMYGTLTIDSTGAYSYQMTANATALGKVEAFTYTVQDNDGHSKQATIYIRLDSNLVTLDWTGKTGLEEANKLVTQLTADNKASAGTVT
GUT_GENOME140955_009054116-4253VNGQQTRAPGLLRVNILNDAPVAAADDNSIDQDRGQQAASGNVFSNDAIGADGAAAGGPVSAISSVNLNRAGAVGGVSLGEFGALTLDARGNYSYVLNRSNSRVASLDANATLSEVFTYTITDADGNTSQAQLTIVIH
GUT_GENOME144729_029501946-2078LSVTDAGGVTTTGSLVVQVIDDVPTAVNDSNSIPVGSLAVVTGNVVSNDTKGADGARVTTVKADTANGLDVTIDPVGNYTVVGKYGTLTIHSDGSYSYARNAGSAGGVSDVFTYTLTDGDNDTSTAQLTINIA
GUT_GENOME243584_000442281-2382GDIDTGDSLTVTRVRTGTEAAGGPASVVPPGTTSANGGLPIAGLYGTLVIGADGSYVYRIDNNNAAVQALNVGDTLQEVFTYAVTDAGGLNDTAALTITIHG
GUT_GENOME080362_026542225-2330SGNVMDNDYHGGDTSTVTGVAAGSGTADVTGNVNTRTKTEYGWITVQPDGSYVYELDQTDPRVATLADGSKLTDRVTYTITDADGDTSTAVLSITINPEQPGAVVA
GUT_GENOME145983_033782585-2670QGDILTNDSAPAGTVVTAVNGVAIAATGTTEIEGQYGTLTIDAAGNYSYTLRSGIGADSIKTPDSFVYTVTAPNGDTSSASLNITA
GUT_GENOME103751_022523584-3682GNVLNNDSAPQDTVVTMVTSTNGNSVTLGSGSSVLQGVYGTLTINPDGSYSYALNPNSPASVVGRTESFTYTITGGGNTTSAKLVITLGNETPASSVTA
GUT_GENOME199866_00861297-411VIRVEITDDVPTIESFEKTVTEGDADPIVGNALEGAVAGADGANFAWTNPDQQGRYGKLTLNEDGTYSYELNNDDPEVKALTDGDTRTEEISYTYTDADGDVATGKVTITINGVN