UHGP-MC 125840

Information

Number of sequences (UHGP-50):: 112
Average sequence length:: 155±18 aa
Average transmembrane regions:
: 0.11
Low complexity (%):
: 33.79
Coiled coils (%):
: 0
Disordered domains (%):
: 10.96
Pfam dominant architecture:: PF04829
Pfam % dominant architecture:: 4375
Pfam overlap:: 0.33
Pfam overlap type:: extended

Downloads

Seeds:: MC125840.fasta
Seeds (0.60 cdhit):: MC125840_cdhit.fasta
MSA:: MC125840_msa.fasta
HMM model:: MC125840.hmm

Sequences list (filtered 60 P.I.)

Protein	Range	AA
GUT_GENOME147138_01145	3794-3956	WGVGSDFQRGMQAATAALQGLAGGDLTQAAAGAAAPYLAQMVKQQTDDGISRVMAHALVQGALAAAQNKNAMVSATGAATGELAGMMATELYHKDASQLTEGEKETVSTLATLAAGLAGGLTGDSTVSALASAQTGKTVVENNLLTGKDALNMLRELEEAEKT
GUT_GENOME143407_04436	200-357	YGIGGTYQKIAQAATAALQGLAGGDMTKALAGASAPYLAQMIKDVAGDDNEAARIGAHAVLGAVLSHLQGNSAAAGGAGALSGELAAIYIKNNLYPNIETKDLTEAQKQVIVNLSSLAAGLSGGIAGDSTGSAVAGAQAGKNAVENNAVSCSTLTCLN
GUT_GENOME142612_01413	3968-4129	SDFGTGGKYNRAIQAVTAFTQGIMGGNIVTAIANGSAPYLANEVKNQIQGNSVESDIQRTLAHGLLNAGLALAKGENVAAQATGAMTGETVGILSHSLYGKTPEELTESEKQNISAWATLASGIAGGLISDNSTGVANAAQAGKVVVENNVFNLAGRKQKDI
GUT_GENOME156716_03460	2517-2682	QSGTGSDIQRAIQAATAAAQGIAGGDISAALAGAAAPYVAEIIGHRSGLDDGMEKAAAHAVASAVLAAVQGKDALAGATGAAAGELAGTLALEMYGKDVAALSESEKQTISALATLAAGIAGGLTGDSTASAVAGAQTGKTTVENNTLAHVLAAAEANKAGTIEQW
GUT_GENOME141306_02816	4593-4774	QWGMGGDKSRALNAVTTAITGALGGQTDLQVAANTLAPYAANMIGEKFGHGEDKNKAAQLVSHAILGATLAYLNGGNPAAGGSAAVASEAAADYFANQYNDGKTAINPETGKFDANLLPENIKSGIRDLTAAIGAVVGGTVGDSSSNAQLAGVIGQNAVENNEFSIITKGVEKKLAENKKEK
GUT_GENOME010376_00720	709-884	TYGIGSEKGMAIRAVTAALQAAAQNDTAGSLVALASPYLNKTIHEMTAGDTAKDKATNLMAHALLSAVEFQVTGKDPLTGAIAGVTGEATAEIIARAYGKPVSELTANEKENISTLSQLAGGLAAALTAKANGSTTEQGGNFLAATSGAETAKRAVENNYLWQEEQKEFEKKMLEC
GUT_GENOME145497_00783	2623-2790	FGTGGKYQQAIQAATAAVQGLAGGNLSAALAGGAAPYLAEVVKTMTTDPVTGEVNKAANVAAHAVVNAALAVAQGNNALAGAAGAATGEVVGMIATQMYGKPVSELSETEKQTVSTLATVAAGLAGGLVGDSGASAVAGAQSGKTTVENNYLSVSEKTELEIAKQTLK
GUT_GENOME171513_00871	3690-3871	TYGTGSAMQRGIQAATAALQGLAGGNIGGALAGASAPELANIIGHHAGIDDDTAAKAIAHAILGGVTAALQGNSAAAGAVGAASGELIATAIARQFYPDTDPSKLTEEQKQTVSTLASVSAGIAGGIAGGNTAGAATGASAGKNAVENNYLSVSEKTELEIAKQTLKNSKDPAEREKAQQKY
GUT_GENOME231238_00885	2923-3084	EWGNEGKYRRALDAITSAGVAALTGQSAQGIAVTAASPYVNQAIKNATTDEQTGKVNKVTNIAAHALWGAVESNALGGSSTAGALSAGGAELVAPQIAKVLYDKAPNELTSSEKQRVIALSGVIGKAIGGITSAAKGGDTYAISKNSDISGNIAKNAVENNS
GUT_GENOME147130_04577	59-223	AMATYGTGSDLQRAIQAATAVTQGLTGGNLGQALAGGSAPYLAHEISKYLPADQNQTANLMAHAVLGAVVGHFNGNATVGAVSAFTAEAAAPAIINAMGWDKDHLTEQQKQTVSALGTLAAGLAGGLVGDSSNSAVAGAQAGKNAVENNTLSSKDEKLRQDAKWS
GUT_GENOME257704_03663	2733-2895	YGTGGKYQQVTQAVTAALQGLVGGDIGSALAGASAPYLATIIKQQTGNNDTARIMAQAVLGAVVAQMQGNSAVAGAAGAAGGEAIAKVIAEQLYGVKGNDTSGLSEEQKQTISALSTLAAGLAGAAIGSDTAGALAAAQAGKTAVENNYLSRRDVDELAEKAR
GUT_GENOME143092_03474	2855-3024	QWGTGSAIQQGIQAATAAVQGLAGGNLAQAASGAAAPYLAEVIHDMTTTKDANGKEVVNVEANLMAHAVVGAVTAYAAGNSALAGASGAAMGEYIAQQMYPGVKREDLTEEQRQTISALGTLAAGLAGGVTGDSTAGAVAGAQAGRNAVENNWLSVEEADRKAVLERKER
GUT_GENOME052644_01327	2890-3071	MAKYGTSSEIQRGIQAATAAIQGLVGGNLAGALAGTSAPELAHLLKSTEKDLAVNAIAHAILGGAVAAMQGNNVAAGAAGAATGELAARAIAGMLYPGVKQSDLSEEQKQTISTLATVSAGLAGGLTGNSTASAAVGAQSGKNAVENNYLSADQIDNFAARAKGCEARGDCGQIVKEMEDLS
GUT_GENOME144553_02946	2782-2959	YGTGSTPQMVVQAITGVLGGLNAGNPGQVLAGGLNPAVAQLIKQATGDNREANLMAHAVWGALAAQLGGNNAASGAAGAFSGELAARYIIDNYYGGRTDNLSEQERQQISMLATIASGIAGGLAGNSTSAAGTGAQAGRNSVENNYLSVSEKTELEIAKQKLKNSKDPAEREKAQQKY
GUT_GENOME146004_00560	3257-3421	TGSDLQKAAQAVTGALTALAGNNLAGALASGASPYLATEIKKLTTNPLTGEVDVAANAMAHAVLGAVTAQLNNQSAAAGGLGAGGGELAARYIAGQLFPGKTKEQLSESEKQQVSALSQLAAGLAGGLATGDTAGAVTGGQAGKNAVENNYLSNQQRSDRDKEFD
GUT_GENOME007946_00945	2293-2552	SEVAEWESGGKYHRAADALTSTIIGALSGQSATSIAATAASPYVNVGIKNATTNEEGEVNTVANIAAHALWGAVEAKALGGSGTSGALAAGIAELSAPVAAKLSQIINEVSSDESLPSTTAKMKAIVNKIKTIDKGMDPSELSNKEKEMLVGITSFIGQVVAQATSKARGADSDTASKNVKIGGIVAKNAVANNYLSRTEIEQYYKDLKDCNGKEECEKDVKQRNIALSAKHTEELELACGGDKRSSAECSEHREKARDG
GUT_GENOME231626_03420	3573-3745	WGIGGSYSMAAAAVTGVLGGLGAGNLGSAAAGGMAPYIANKIKHATSTFVNGQEQTNVLANTMAHAVAGAVLAQLAGNNASAGAAGAAGGELMARAILRTMYPGKQASDLTQDEKQVVSALSQLAAQLSAGVASGSIEGGIQGAVAGKNAVENNFLSVKKAETFNKSIEEQKA
GUT_GENOME143518_00644	3705-3842	ALAPYAAYFIGSKLDSNHGSDPNATLQLLSHAVLGALLAEANGGNAGTGAVSAAGGELAAKVLTNTLTGGDPSRLSPEQKEMVLALSQAVGALASGLSGQDLAGIALDAGIAKNSVENNFLGNDDHARMVHLREKAKR
GUT_GENOME095843_00426	109-229	PYVNQVIKDVTKDIPSLNLPAHVIWGAIEAELTGGSATTGAISTAAGELGAAYLAEHIFGKKAAELSPEERSKVRDAAKAIAGIAGGLSSAMQGQDLVSSLNDTSVGLTVANNAVENNYLT
GUT_GENOME095841_01103	2475-2643	KEWETGGSQRLVIDSALNVISTALAGRPAAEVVASGLSPTVNNQIKKATTDAKGNVNTALNLTAHALWGAVEAYAGNRNVAAGAAGAAGGEAAAHFLASTLYDKSPEKLSEEEKRTVSSLSQVAAGIAGGSLSDSSDGAIIAAKTAKDSVENNSMADDVHPSDERKQNI
GUT_GENOME096384_02217	1848-1993	QSVSGILAGAAGGDLKKALAGGLNPLMAQTIKGATTEDGKVNESANLMAHAVWGALAAQLSGGNAAAGAAGAFSGELAARHIAAEMFPGKDPGDLSQDQKQVVSLLGTMAAGLAGGVVGNSTASATTGAQAGKNAVENNYLSDKDI
GUT_GENOME102159_00067	2438-2626	EADKWQTGGEYKRKIDGAMNAISAALGGLPAAGIATSALSPEINHQIKLATEGSPMANKVAHAVWGAVEAYSANQNAAAGAGGALAGEVMADVIAKELYGKKPNQLNREEKEVVSSVSQAAGALVGGAAANSSQGIGVGLTTAKNAVENNFLSDASRARLNALKTKYHRGEKLTNKEKLEFRDLIESDQ
GUT_GENOME121634_00177	2303-2463	VGEWGYGGGNRRAIDTVTALFTSVLSGQGASATTVATLSPTVNKLIADNTHDKATNALAHAVWGAIEAQVNGGSAAHGAISAAGAELLAPQIASILYGKSEADLTPDEKAGVISMASLAGGIAGAIMNGKSEGVEIIGNTAINAQIAENTVTNNYLSGWQA
GUT_GENOME231557_01047	2949-3104	RAMQAATAAVQGVMGGDLKAALADGAAPFIANEIKKQIPDEEADANLKRTIAHGIANAALALAKGENVAAQATGAMTGEAIGILAEYIYNKQPGELTEREKENVSAWATLASGLAGGLAGGDTQSVANAARAGKTTVENNLLSPEKDDRRFKALEA
GUT_GENOME032708_00173	2427-2562	GLLGGETLTQAGLNASAPYLASTIGQTFGEKGTHPNREAQLMSHALVGAIMAYVNGQNPGVGAGAAAGSEFVAKYVAKALYGVEDPDQLSYDEKRSVASAVSALVGLGTSLTTSDMISAQTAGALGKTVVENNYFE
GUT_GENOME143489_00975	2542-2720	AQESFGIGSSFWTAGMAVSAALTGLAGNADIGSISSAAVAPYLAGQIKKYTTDKDDKVNKTINILAHAILGGVVAQMQGNSATAGALGGGGGELAARIYMDQVHPGKKVSDLSEADKRIVSAIGTLTAGILGGLSTDSSTGLITGAQAGKNAVENNALSVAQTQSLIKEMSQCQGGKVC
GUT_GENOME171447_01643	50-207	EYGVGSDFWRNGTALTGLLAGALGGNVTGGMATGAAPYVAGQIKSVADGHESARIALHTLASAVLVQLQGGNAAAGAAGGFIASSGSEALSLAFYNKEPDKLSPDEKTVIVNLVAALGAAGGSVAAGNSSGTGSGANAARVEVENNYLSSTEKSRQTY
GUT_GENOME231670_01212	3259-3409	QKVAQTVGSILTGLVTGNAGQAVAGGLNPWAAQLIKKETTDASGNVDVATNAMAHAVWGAVSSQMSGGSAAAGAAGAFSGELATRYIVEKYWGADTPEKIAALGQEDREQLSLLGTLAAGLAGGMAGNSSAAATSGAIAGKNAVNNNLFGG
GUT_GENOME096136_03155	3407-3552	DNRRMVEAGTALVQGLASGDVNKAIANASAPYIANEIAKNIGEDNKAGRLAAHAIANVALALAKGENAGAQSLGAFTGEAVGMLSEKLYGKEPSQLSESEKATVSAFASLAAGIAGGLVGGDTSTAANAAQAGKTTVENNLLSNKF