UHGP-MC 42212


Information


Number of sequences (UHGP-50):
114
Average sequence length:
90±15 aa
Average transmembrane regions:
0.04
Low complexity (%):
7.27
Coiled coils (%):
0
Disordered domains (%):
3.56

Pfam dominant architecture:
PF00528
Pfam % dominant architecture:
88
Pfam overlap:
0.1
Pfam overlap type:
shifted

Downloads

Seeds:
MC42212.fasta
Seeds (0.60 cdhit):
MC42212_cdhit.fasta
MSA:
MC42212_msa.fasta
HMM model:
MC42212.hmm

Sequences list (filtered 60 P.I.)

Protein Range AA
GUT_GENOME121578_0157813-103ISGIIMGIVERYSIIPFVLYFTLAIPTAPKVPITAEIPQLKTPSKMLLKSASFKSLSLAKVAYHLSEKPVKLAESLDSLKEKITTITRGKY
GUT_GENOME132092_0079788-206AKAPHPLKNTTNSRHRLTPVTISAFIMGMLLTELTMVRRRRLMAYSPMAANVPAMAAAMVDSSDTIRVVYTLFMISRLDSRDSYHFREKPFHTLELVPALKENTMRMMMGAYKNRNTSA
GUT_GENOME022604_014759-85LRDIELMPRVASVPSTVAIMLDTSASTRLRPSADKIISLWNRLLYQPRVKPVKFERDLLSLKLNAIMTAMGRYMKQN
GUT_GENOME129393_0069423-122SETPVTISGLTMGMFVMFITIALGTLRMELIPIAARVPSSVAAMLAITAIMMVFISEEMMTSLRNSFAYQSSVNPLNTERLLVSLNENTISTKIGTYRNI
GUT_GENOME225747_0125922-121KSIIETPVTISGFIIGILVTVITLDLTAPFFILSIPTAASVPITVAVIAEVTARMSVFVKAVIVALSLKSSTYHFVENPCITLVLFVPLNESTMSIIIGR
GUT_GENOME070966_0101621-118SIRDIPVTMSAFSMGILVMPMTMVLGTVRMELMEMAAAVPMIVATRADTKAMINVVVRALMMERLSNIWVYHCRVNPPHWVLDLDLLKDRTIMVRMGA
GUT_GENOME254093_0087185-185IEIPVIISGFVIGISVTVFIAALYQRERSLSIPRAASVPIIVDIAVAEAARISVFLTDSSVLRSRKSSSYHFSEKPEKTERLFPSLNENTSRTAIGAKRKI
GUT_GENOME204129_0095113-101IGSMDTYSMGPLVRRRSFWKPTAPSVPMTAAARLAHRPSTMLFHRDSNRALSRNSSRYHFSEKPPHTLEILLSLKEYTATSTMGRYKRA
GUT_GENOME132573_007595-101PVTISAFITVILPIPFTNRFILLPRRSIPTAPTVPIIVERVEEINARTKVFFTASNISSLLKSSAYSPSDQLSPSQLPIALVSEKENTIKITMGAYT
GUT_GENOME194074_0024424-125SIKDIPVTISAFNIGILLTAITTVLGTFLILLIPNAATVPIMVAISADKNAITSVFLKADIIVALLKSSEYQSSVNPPHLFLDFEVLKLRITKVAIGAYKNI
GUT_GENOME041759_0060411-80FMEWMPIAANVPTTVAISAESTAMESVTHSASINAESFTSASYHLREKPPHLPMVFDSLNEKKTSTAIGA
GUT_GENOME274453_0134910-109IPRTISGITTGIYKSPSIAALPLNLNLYIPTEASVPMIVASIMLVIAIIIVFPNDCKSVWLSNSLTYQSNEKPFQLRYGLDLVALNELATMYIMGANKNK
GUT_GENOME066747_0101898-190NSNINPIAVTISGFNIGRLFTCVTISFTIFLDFDKPIAVIVPTNVDTIVAMTAISTVYQIASIIERLLNIASYHFVEKPVNLVKDFERLNEKN
GUT_GENOME207301_000801-121MQNTMWAMRMVNNDSFRPMKEKNIRVATAVTISGTSNGRPSTPFIRVCPRKARPRMPSAARVARTVEARVARVATISEFFAARRISGSLATTAYHFRLKLSQSVADWPLLKLSATSTRIGM
GUT_GENOME129974_0183322-118ISEIPVTISAFNMGMLEIPIKIFLDTGFMWLMARAVTVPMTVATSAEIIATSSVVYKAYMIARLWNICVYQLSVKPPQWVLDFDWLKERTIMVKIGA
GUT_GENOME084635_000344-107TIMETAITISLLMMGNWLTFSTMRLALLPRLKMPIDANVPIIVATTEEMPAMIKVFAIALQRSGDLSDLKIEMYASKLNPLSKLKFELFEKEYTMSKIIGAYKI
GUT_GENOME264510_032334-73MPIQARVPTIVAMAAAAKAMVKVFHMASIIMLLPSISLYHFSENPVQMDIDLLLLKENTINVRMGRYRNN
GUT_GENOME155528_0175740-146NRSIREIPVTISAFSIGIFVIPMRTARLVRFMDCMAMQAIVPMRVAISADKIASASVFHKACMICSFRNKAAYHLVVKPPHFARVLLALKESTIKVIMGAYKKIKIS
GUT_GENOME076214_004691-78MPVTMSALRSGTFARPRMTSWLFFEKLRMASAVTRPRSVAKNAAVRPIVNVLRKASMMSSLVKSFSSHCKVKPVHWPR
GUT_GENOME234084_010041-70MPIAENVPISVDTTLDTAAIISVFLSAASSSGVLSDANIDLYDSKLKPLSKEKIDVLKNENTIISTIGAY
GUT_GENOME225744_014481-75MPIAPSVPIMVASRVLTRAIIIVFPKDSNRDVLSQSFIYQSKVKPFQLMYGFVVVALKELTTITDMGKNKNRYTR
GUT_GENOME134132_0155144-138TPVMISAFSIGIFKSFMEMLLLIGDIFAMIKAIYVPSTVAMTEAQNATSSVLRSAMSISLFWNISTYHCVENPVKSARVFPLLKENKIITKIGAY
GUT_GENOME180141_012949-79CIPIAAVVPSTVEMTVAMAATSNVTFSAAIIELLVNSFLYQSSVKPVHSARDTDWLNDSAIMMTIGRYKNA
GUT_GENOME089401_0078821-119MPVTISASSMGIFVMDMQMFFGTLRSALIPIAAAVPMMVAIRAESRAMSRVLYSARSIVSLEKSSAYHFSVKPPQRLRDLLSLKESAIMVSMGRYKKSS
GUT_GENOME211189_006648-112SIREIPVTISALSSGMLFIPMRIVLCLSFIELMPMQAATPTTVAITEAQKAMVTVLPRASMICLLENISSYHSSENPTQAFMVLPPLKDSTMRVNMGRYKNSMMR
GUT_GENOME064756_0266667-134LIAFVPTTVAMHAAAKATPSETPRLFSTMSLWNRFWYHLKVKPVNTVRLLLSLKLNAMSTAMGTYKKP
GUT_GENOME259047_0044813-83LRLFESPIAVMVPSTVDIAVARNAIVTETETADMISEFSISCEYHLSENPVKFVSDFDELNEKTTVTIIGI
GUT_GENOME003150_006317-86RVFLPIQNIPIVANVPSTVAAEDETTAMRSVFFMALHSSGLLGLVKIETYDSKLKPLSKLNLLVLKKENSMTNRIGAYMI
GUT_GENOME017851_003141-88MDRPTITSGNTIGAVIKSANKDSPLNLVILANTIAAKVPKITDMHAVAKEMSNEVPTADIICLSANKAKYHLMEKPPHTVIILELLNE
GUT_GENOME204661_026709-94MMGSVDTYATTSSVFRFLRLIPSAPEVPISTAKAQLNTARIRLLISASPKSLSRNNSRYHFKENPSQTEVSFEALKEYTTVRRIGI
GUT_GENOME261555_0236228-140FRIVPANANSSASATPVTISGFVMGMFVMVMTAERSRPFMLWMPTAAIVPTMVEMSVASSAMMTELRSSVRSVPSRNRLAYCRSVKPLKLAISVPVLNEATARTIIGIYRKMN
GUT_GENOME212282_0515617-84RCRATPARVPSRVATLAETSAMTSELAAAWSMSRLPNSLRYQSRVKPTHSAFSRESLKEYSTTITSGT
GUT_GENOME128802_017907-109VTKPRFKNFTKSSMSDIPVTISAFNSGMLVAPSISVVPRFFIALMPMAASVPISVESTAAQSVICSVMISAFMIVLSVKQEEIALDYLVAYFNGQRVKVFAYL
GUT_GENOME237526_0037229-97KAAMVPMTTEAAAAITAMVSDMHSAEMIAESCTRTLYQCSEKWVQMVTIFDSLNEYTTNVMIGVYRKMS
GUT_GENOME069717_007067-121PSGSLTLMKKMSSEIPMTISGETVRTYREACRSWRPGNSVRLRHSAASTPSSVASEAASAATESVFTTASINAALPKSWLYHLSVNPFHADVYLAALKEYAITTKMGKNRNAYTI
GUT_GENOME161466_0222912-109IPMTISPFSIGILVMPMKTVRLFFDMLLMPMHASVPSTVAIAEARSAMISVVYSAFMISVLANSERYQCRVKPPHLARVFEALKESTTRVTIGAYRRI
GUT_GENOME019904_0137913-97IGMLLTVRYAALVRRPMLWMPMAATVPMSVASTAAITATSRVTYSECRMSASWNSSAYQRVVKPFHRRRDLELLNENTISTTMGA
GUT_GENOME038853_0101320-123NRSIIEIPVTRSGLTIGSCVIDSTTARGRFFMECRPIAVAVPITVARMLEITATSSVVSNASITSPSEKSAVYAPNENPFHIAAERESVNDITSITAMGRYINS
GUT_GENOME127331_0313120-126TNKSIIAIPVTISAFKRGMLVAPNMIALFFFFMALIPIAASVPSSVEIIAAASVIWIVVTKAFVIVSFLKHSAYHFKVNPPHTTRDLELLKDRTINTKIGRYKNKNI
GUT_GENOME071849_002268-80STRLRMIFLDLLSPIAEMVPATVETKVAINATLKVVYRASIISPDSSIWRYQRRENPVKLVNDFPSLKENTII
GUT_GENOME256384_0111583-183MNSSIKPMAVTISGFMIGKSFSCSTAFLSTLRQRDRPMALIVPSSVETRVAISAMTIVVCSDSIMSRFSNIRSYHMRLKPSKLVSERPELKEKMIMNRIGT
GUT_GENOME041463_017415-86LLTCKIVVLITFLDFVKAIAVIVPKIVEITVAKIAILTETTTASNNCKFPNNDSYQRKEKPLKLDNDLALLNEKNAMTIKGK
GUT_GENOME246796_007099-71FFFMASMPMAAAVPKIVAHKAASTAMDSVTHSASIITLSLNNSAYHFSENPPHLPMVRLALKE
GUT_GENOME234402_0124122-119IIDTPVTISGFIIGTLVKDRIAAFTPFLRIRSIPRAPSVPITVAKAEEQRARIREFFRALNASVSRNSSLYHLKEKPEKVERLPDSLKEKITNTNIGA
GUT_GENOME254903_006611-74MLFMPKAAVVPKMVAKTDATSATMSVLINAPMMAWLRNNSTYHLVVKPVQVAPLLVLNEKTIRIRIGIYRKAKQ
GUT_GENOME259921_0148724-120EIPVTTSGFIIGMFVAVITALLSHFFLIFAIPTAATVPSTVAMTAEITASRSVFFNASIRLLLYKNSSLYQRTEKPLKIDVLLAELNEKTIITKIGA
GUT_GENOME161675_0006391-185PISEKKTMNTMPRMISGIISGSVEMYSMRPLPLSWTFDEPTAPSVPMTAAAHEDETPRMMLFRSDSKSARSRNSSSYQLSEKPSQTELILLSLNE
GUT_GENOME101915_0147739-129EKNARYAMPRMISGTMMGMREKFSSAPRPRKCLPAMPTAPTVPSTEADRLLSAASSRLLKKAVMMFRLWSSFWYQEKVNPSQLKSLVSLKE
GUT_GENOME223719_02505121-213TNSSSSDRPVMTSGITSGAVIINAKPFAPRKRPKRTITSAAIVPSTQAIVAASAAMVRLSPTALIIASSWNSSLYQRVDQPAQTVTSLELLNE
GUT_GENOME235717_0145610-128PCEIPQLTNSRNSDTPVMMSAFIIGMALAKFITRRVRVRRLKIPMAAMLPNAVLAVAANMAMAKVFQMALVSEWCMPPVKRELYSLVENPVQLPSTLASVKENTMMIRIGEYSSASSSH
GUT_GENOME131749_0114632-130ETPVTISGLTIGILVTVITAFRARFRMAEMPIAAAVPMTVATIAATMATIRVFLSAPKICSSWNSFLYQSRVKPPQMLRLLDLLNERTIMMTIGAYKKR
GUT_GENOME105638_0071794-188PNREKNARNTIPSMISGIMIGMVEMYSTMPLDLDWMRDMPTAPRVPMTAEALQLKAASMRLFLNASFRSRSPISSSYHFSEKPPQIEEILDSLKE
GUT_GENOME069710_010162-86IGKLLTCCTRVLTVFLDLDNAMAVIVPKTTEQIVAITAILTDTKIAFNSCVLLNNCTYQRPEKPPKCDKDLALLNEKTAIINIGK
GUT_GENOME064627_008277-75IALMPTHAMTPMTVETTEAIRAIDSELPSALMMRSLWNISAYHSSVNPPHTARERDALKLSTMSVRMGA
GUT_GENOME093145_003515-106PITMSALRSGMLLSPIRKVLLFSFMALRPRHASTPTMVDMTAAQKAMVRVLPRASIIISLSNISLYQSREKPTQAFIDFPLLKERTIRVPMGRYRNMTIRAR
GUT_GENOME259531_0159318-88MPKIPTAATVPKTVEQTAVAPASTNVFFSACIVAASRSISLYQYVEKPLKFDVPLAALNENATVTMSGIYI
GUT_GENOME189710_0127581-183SIREMPVMISGLTMGRLVTVFMAARMYLLRSLFIPTEAAVPRTVERMAAHRASTRVFRRASRVLESWKSSLYQYREKPEKTDRLLPLLKEKTRRMAMGAKRKR
GUT_GENOME083223_0081813-109PVTRSGLTIGRRDIFSTTALGRFFMECMPIAAKVPMKVATSADITATERVTMRAFIMVESCISASYHLKEKPVQRAMDLLPLKENTISTRMGAYRNI
GUT_GENOME266025_005568-74AAHVPIAVEKRVATQAIISVFIVALMTAESRKSASYHFRENPIHLPPYLEALKDCVTSMTIGRYINA
GUT_GENOME157173_0123739-134AEKSINRLIAVTISGFMTGNSLTRSVAFRKNLPLFESPIAVIVPKIVATIVEMTAMIIVYQIELIIVGSLNIFSYHWSEKPSRTVSERFPLNEKTM
GUT_GENOME232624_0065910-94APRSQRLRMVFSPSAPKVPMTVAISAALTASTTELRREVRASSSANSSRYHFSDTPVKDARLPPSLKENIISTRMGTYSRKKMRP
GUT_GENOME239069_005389-86SNKAESFPRERTSPTAPTVPIAAETPQLIPARIRLFFKVSKSTRSENSFSYQRSEKPLHTVANLESLKENRMTAKIGR
GUT_GENOME141051_0106623-120EMPVTISAFSMGMLVTPIMVVRNFRCMDWIPIAAAVPMTVAIRADRRAMIRVVYRAFIICSFLNSSTYHWMVNPPHLERVLDLLKDSTIKVTMGAYRS
GUT_GENOME019794_0051442-139SIREIPVTISEFSIGMLLIPMTMVRGIRFMLLMPMAAIVPMTVAIRADANAMSSVLFKAFMMAESWNICVYQWVVKPPQTVLDFVLLKDKTIMVTIGM
GUT_GENOME217812_0023999-194SPMAVTISGFIIGKLLTCSTVFFNIGLDLDKPIDVIVPTTVEIAVDKTAMTIVYTTDSIIVLSLNIFSYHLSENPSRCVSEREPLNEKMIIYIIGA
GUT_GENOME018093_014702-55VAKVPSTVAMIAETNANTSESPKAERIISLWNRLAYHFKEKPVNTARLLFSLKL
GUT_GENOME023686_0107011-84FMLLMAMAAAVPMRVAISADKKAISSVFCRAAIIFLLENIWVYHCRVKPPHTVRDFDWLKERTTMVAIGAYRKI
GUT_GENOME062068_0073926-130NTNKSISDTPITMSGLIIGMLDALCISNLFLPLKLLIPIAAAVPSTVAKIDASTAIISELPRAFIILSSLKSSSYHLNEKPFHTVVLPSLNENIMSTKIGRYKNN
GUT_GENOME259172_0028621-103MPRMISGSIIGIRETFSSRFCARKRDLAMPTAPAVPMRIDSAHEETARNSEFFSERMICVLRKSFSYHSREKPSQLPYFEALK
GUT_GENOME217277_0151014-105VTISGFIIGILFTLRIASLNTFLLLDNPIAVIVPRIVETAVAIIAILIDTYTAAIILLSVRSFWYHFNESPVNLVRDFDELNEKIIVTRIGR
GUT_GENOME244143_011071-70MAIAEIVPTIVEIIVATRATKIVVQSEDKIAGSLKSCLYHFRVKPAQDPLSFELLKLKTTKIIIGAYKNI
GUT_GENOME222296_004371-64MAANVPTTVATSEDTTAMLKVTQMLSKMSGLVNSFLYQSKVNPDHLVMDFPSLNEKIISIRMGR
GUT_GENOME014975_0204819-118SPNSNFIVANKINNETPRIISGITKGKNVIIFKYFLCLKLYQCNPIAPNVPIKVDVVLEIIPMNKLYLNAFQILSEYRKSSLYHFNENPCQTLDFPSLKE
GUT_GENOME235748_010061-69MPTAAMVPSTSAMTDAASAMIKVLRSEERISSLWNSSLYQWKEKPVQLARDLDSLKLNAMSTMIGRYRK
GUT_GENOME052928_0112220-121SIREIPITMSALRRGILLKVITAVRVDFFMPATPIAPSVPMTVAMSAERNAIKKVFPIASIIMGSAIILLYQSSENPSQTAIERLRLNDRTIKVIIGAYKKN
GUT_GENOME230027_0042921-130PTNINSSIREIPVTISAFIIGICVTDIMIFLGILRLIAVIPTAAAVPSTVEIKAEDTATIRVCCNALIIAVSDVSPAYQRVEKPFITHTLPLSLNEKITMTATGAYRNKI
GUT_GENOME018038_0114284-189NSIISETPITSSLLTIGMFVISEIMFLTRLLRKPCMPIAAAVPIAHEITADSTPTMSVLRSAASSCISESICSYHLSEKPPHTPLDLDSLNEKAMSTAMGTYKNMN
GUT_GENOME043687_0083810-80MEWMPMLAMVPSTVATTEATSAMTSEMPSALRIISLRNRFRYQSSVKPVKRVRLLDWLKLNTAITAIGTYI
GUT_GENOME278789_0030273-172EIPITISGLSIGRYVTFLIAFFAALFFMENTPSAAPVPRIVETTDAAAATISVLTSELRISSLEKRSLYHCKENPFHEYPFVELNENTIRTKIGRYKNSI
GUT_GENOME204947_0099666-179VVNPWVMPNDTNSRNKEIPVMISGFNIGMLLTKLTALRALAFKLKIPIAATLPNKVDTVAAIMAIANVFQSALTNECCTLPAKRELYNFVENPVQLPSTFASVNEKIMIIKIGE
GUT_GENOME238805_006729-83FILFSPIAARVPSRVATTDEAMATTSMTTNDWMMTRSWNSSSYQRRVNPVQVLRLLLSLKEKTISTAMGAYKNSM
GUT_GENOME231545_0149036-135KNSIMDTPVMMSALVRGMLLMVVTTVRLRRRKLVKPMAAAVPMMVEITAARMETASVTHRASRIMEFWNSSLYQSRVKPDHTDRLLDALKENTMSTKMGR
GUT_GENOME077722_01162120-214PVTISGLTMGTYERFNTTARLRRLMLFTPMAASVPSTVAIIAEAKATTSETPSACRIISSPSRFLYQRSEKPAQTLRLFDSLKLKAISTAMGTYM
GUT_GENOME199381_0125025-131SIRETPVTISGLTIGRLVTFIIMRRTHLLRIPLSPMAATVPSTVATAAATTAMISVFLSASIIMRSSNRRAYHRSEKPENTERLIVSESLKEKIIKTKIGAYRKRKT
GUT_GENOME007520_0047630-133NTNISISEMPVMISGFIMGIFVTVSIVARRYLLRIRLMPTAAAVPMTVETTDALSARISVFRTAPSVSASFISSRYQLREKPEKTERLLASLNEKNSSIAIGAN
GUT_GENOME221723_009672-66YTAAAVPITVAITADAVAKISVFSSAFIVSREANSSLYHFSEKPVNTDVLRPALKEKNTITRSGA
GUT_GENOME079933_008541-64MAATVPITVDASVASAATLTVTYSASRISLSIKSAWYHLSEKPPHTARVSEALKEYTISTTMGA
GUT_GENOME243741_0070014-112PNGRPSREKNARNTMPRIISGVIMGSIEIYSTTFLVRACILVKPTAPRVPMTAAASEEDSPSTMLFTSASNMALSRNSVSYQRREKPLHMVEMRFSLKE
GUT_GENOME238205_0111311-103PVTISGLTIGMLLTAKNALRSLPFIAKIPSADNTPMTVAMRAESNAISSVTFKQSRISALPNSFSYHRREKPLHFTREEVLLNEKTISTTMGA
GUT_GENOME249105_0064184-187EIPSTISGITTGIYKRAFIIPFPLNLYLYMPTAPRVPMAVASTVLTTAIIIVLPKDVSSASFSNNFTYQSSENPCQVKYGFLVVALKELTITTTIGINRNIYTS
GUT_GENOME089430_0182518-117MPSLKPTAVNTERYAMPSTSSGIIMGSVARVSTVPPNFRWDRASPMAPSVPTPPASRAETTARISEFLSASAIRALENRRLYQLVVKPCQLPMVRPLLKE
GUT_GENOME239157_006072-69LLIPTAAAVPITIEMTEETTAKTSVFLNAARVVVSLNSSPYHLSEKPVITLVLADALNESTIITSMGA
GUT_GENOME215276_007021-66MPMAPAVPRTVASTAAAKASHTVLNSIPMISAFLNSWRYKSSEKPVHCPMIFEEVKLYTTKRRMGA
GUT_GENOME022499_011818-93MGMFVTFMTSDLMWRLFSECMPTAAAVPIAVASIDELTARIRVFIKELIVSSFANNSRYHLSEKPVKTAMLFDSLNEKNMRTIIGA
GUT_GENOME218470_016664-102EIPIITSGRTMGRKLMLWMYDFPKNLYQLIPIEAIVPRIVATSDEETATIMLFRSACQSGFDSKMSFWYQTKENCVKRVSFDALNEYRTITKSGIKRNR
GUT_GENOME205641_0025997-199SAIPVTMSAFSIGMLLHPISTVWVLCFIPSIPMTAMVPIIVAISAASSAMEKVFTSAPRISLLWNISPYHFRLNRVNTDMDFASLNDSTISVSIGRYRNSMII