UHGP-MC 107408

Information

Number of sequences (UHGP-50):: 83
Average sequence length:: 114±22 aa
Average transmembrane regions:
: 0.02
Low complexity (%):
: 10.54
Coiled coils (%):
: 0
Disordered domains (%):
: 1.57
Pfam dominant architecture:: PF03389
Pfam % dominant architecture:: 120
Pfam overlap:: 0.34
Pfam overlap type:: shifted

Downloads

Seeds:: MC107408.fasta
Seeds (0.60 cdhit):: MC107408_cdhit.fasta
MSA:: MC107408_msa.fasta
HMM model:: MC107408.hmm

Sequences list (filtered 60 P.I.)

Protein	Range	AA
GUT_GENOME231259_02362	1-150	MIYRKKILTGLFLFVTLILVQAMPVLAASITEADVQSVGKETAAGNVLVWFLCAVAFLKISQKIDSFMSSLGINVGHTGGSMMAELMIAAKGLTTAKNMAGGAMFRGGSFHGGSSAQHMSSASFMSGGLAGAVSRQFAQGAMQSATGQGG
GUT_GENOME254321_01692	189-295	MFASMCLMMVMNIIFLKLLISAMGYVPSGLGVLPWMLLIVGIARVARKIDSVVARIGLNPAITGDGLGRGLPGMVAFAAIRGLGMAVTRSASAASKGSGGAKPHGGH
GUT_GENOME078723_01346	87-243	LKKILFLALMVAALSCLFCQPAFAISEEEVQAQVDAVGKEAVSGNVLIWFMCAIGFLKVSQKIDSFMASLGVNVGHTGGSMLAEAMIAARGFSGFKSFASNHFAGGRSSHSSHVRANGGGKGGAGFGAGFASGGLAGVIKRNVTNNAVKTATTPPDA
GUT_GENOME009394_00038	417-560	AVVYCITMWCINITLFLIEKAPDKCAGMNNTLEEIVYFFIIIGFLKIAQKIDSYLKDMGMTVAGTGANLGRAALESMTLGYGMFRMGTSAYRMGKGALRTSGALHGSLNNTLFNATNGQAGKPSKGAKNEATLTQSANYAKRKI
GUT_GENOME025908_00858	1-96	MNKKLKIVLLCTFMLCTVFAVNCYAITDADVKNAVDAGSKESVSGNLFIWFLCAIAFMKVSQKIDSFMNSLGISVGRTGGSMMGEAMIVAKTVGSA
GUT_GENOME096793_02061	3-136	KKLVAVGGSSLMLSLICCTQAFAIEESDVESAIAASSNEAVAGNIFIWFLCSVAFLKISQKIDSFLAGLGINVGRTGGSMLGELLIAGRSLGTVAGGLGSAVGNIFNRNHANGNTTTNQAAGQAFTGGGNSLIG
GUT_GENOME095705_02760	198-283	MFGSMCVVMVSNVFFLKVILSALSTIPNTLTIIPWLIFVVGLCKVARRIDDILCRLGLNAAHTGRERMFPGAVTAMFLRSAANTVR
GUT_GENOME260268_00865	199-315	MFGSMCLLMATNVMFVKMLLSVLSYYPSGLDVLPWMVLVITIVKVAKKADSILARIGLNPAMTGDPLGRGFPGAMTMMVVRSLVSNAAHTIGRNSGQQRSGSGNPKPNAPTGPRTSG
GUT_GENOME021981_00404	242-336	VGCQLFLMICNVFFFKMFIYGFSRFNETMAAMSGINGGETTGMMIVWVLILFGILYVGQRVDAYMSTLGLNAAQTGRGMGAALVASALGAGRAIQ
GUT_GENOME185468_00586	233-351	MLVSELMILALNVWFVVVFRNAIIVNSMIAGEYEVNGHTVGSGILWCFIAIAFLKTAQKIDSHIATLGLTTAQLSSGIGATLLATGMGIGHMARGVSNGIKNARNAMSGRELAAAKKFD
GUT_GENOME074108_01095	9-143	KPFIFATALFFILSCLGVVPAAALTEDEVQQQVATEGSAAVTGNIFIWFLCSIAFLKVSQKVDSFMSSLGINVGHTGGSMLGEAMVAMRGIGLAAKGITGKSFGSSGGGGGSASADSSGNVAFAGGLAGIVSRKF
GUT_GENOME046130_00151	194-298	GWARMYGSMCFMMVSSVIFLKMLISALGYVPAGLDAIPWAILIVAIARVARKVDEIITRIGLNPAITGSGLGRNLPGMLAYTVVRGMTSTISHTVGRSMGGGATQ
GUT_GENOME231183_02394	5-145	RKIFSCVVCALTLATVLAMPAFAVSESDVQAAVAANGREAVSGNLFVWMLCAIAFLKASQKIDSFLSSLGINVGRTGGSLLGETAIALRALTMHGSRGGAAAHAAAPGSSAAPGSSRFLQGGLWGASSRQLTRAAVQSATG
GUT_GENOME136708_00224	199-308	MYGSMCLLMVMNVVFVKMLLSILSFHPSGLAVLPWIVMVLTVVKVAKKSDAIITRIGLNPAITGDSLGRSFPGVLTYTVARTMASRVVQTAGKNTAAGKTGAQTQTKSGS
GUT_GENOME001016_00708	295-432	LMVMNVFFIALFLKSVSSFSTSIKTIGENNNSTAKIAIVITWCIVEFALLYVAGQFDSYLNTMGFSTAETGAGMMASMVMDAIDIGTINPLKGRKGKAGGFIAKRREKNAESSPRTPSLSGPLSRLRRNSPIKRKEGQ
GUT_GENOME024418_01507	208-311	KAWFQMVISTVLLICFDVLFIRGANSAFAAFAVKGATTDSGDGFILLWVIAIIAFLKVGSNIDFQLKNMGLSAPQTGGRLLNSMIIDGYGISRIGKGVAQSFTG
GUT_GENOME094508_00744	200-293	YASMILLLISNVLFLKLILSAMGTMPTGLMVLPWTVLIVGLAKTARKADTLLSKIGLNPTFTGDPLDHGTGRFVAMLAARSVINSAMHTSGAKA
GUT_GENOME012310_00497	12-144	SVFAVIFSVSVFAVIFSVSVFAITENEVQNEVSRIGREGVTGNIFVWFLCAVAFLKVSQKIDSFMSSLGINVGHTGGSMLAEALITAKSIGSTFRGGGKSVSAGRSNGASVNTAAFKGGLSGMVGRGITGNAV
GUT_GENOME028199_00949	211-300	MFLGQCLLMLLNVWSVKMLMSILANGQSDVFLRFILAIAFCRVAQKFDTYLQSMGINAAHTGGSLADDLLALGGTLKSTAGGIITGAGNK
GUT_GENOME089404_01331	242-345	LQMFWSQCVLLILNIWVVGIARTALNNGLFGASNTEMVKWGLITYAFLKIAQRLDDMMQTAGLKITRTTGLDPISEASGVLRSIGNVFGGVASVAGHVAGVGKN
GUT_GENOME197990_01456	5-156	MRKRFFLNCLLILTLVVVMSTSAFAISESDVESAVSASGKEAVSGNVLVWFLCAIAFLKVSQKIDSFLSSLGLNVGHTGGSMLSEAMIAMRAINTATSAVGSALGSRSRHGSAPASGKSGSGSAAAAGFFSGGLVGMASRKIASDAVRTATT
GUT_GENOME025789_00911	269-374	LLNIVFLYAYLSAVAYANANGKITLDFAQDALSGNNGVLVWYWATLAVLKVGRQIDQYLSSLGMSVASTASNLGNEALMAAGTMMAGLRTAGAGRQLVDKAARKAG
GUT_GENOME060255_00914	218-338	ELLILVLNLWFMVIFQSAIIDNPMEKSVTVNGYTCGGILWCFIALAFLKTAQSIDSHIAALGLTTAQLGQGVANTLLATGAGLRRGARAAQHAFGLNPATVFAGNASNGTTRTQRKAAQGL
GUT_GENOME222479_01247	123-228	GWCRMYGSMLVMMIMNIVFLKLIMSAMSQMAAGGVLIWLVFVVALTRVARKIDSHIGKIGLNPAQTGSGIGSRLPGMMTMMAVKVMSSTVSRSLAGAKGNTGKNGS
GUT_GENOME141051_03862	210-320	MVGSQLLLLVMNVWFLRGFNSSMGQYIGNGGALSTGQGSIFLWLFCALAFLKTAQKFDSYLAAMGLNVAQTGSSMGMELMMAARVISGVGGGVRNAGSMFHSTSTATGTGA
GUT_GENOME255591_01196	13-156	TRICVIVLILVCVCTLPALAISEADVENKVAAVGREQVTGSVLIWFLCAVAFLKVSQKIDSFMSSLGVNVGHTGGSMLAEVMIAAKTVSSVASGAGRFFGGRSHRGAGASGSKGADGSPGFLRGGLAGVVSRKITNDAVRSATS
GUT_GENOME104393_01502	2-145	KKTLFTLLTAISLAFLYCPAVAVFALIKDETAAAVGAQGKDAVSGNLFLWLLCAIAFLKVVTKLDGILHSLSIGVSRSPGSMLSEVLLAFRGFEIGQAFMGLGLAKAAAATTNTKTTPGNIFASGLSGMVSRHVQQSAASSISW
GUT_GENOME096140_00826	6-153	LFLFAALAACMVLFFSVPALAAKLTEADVEQAVASQGKETVTGNVFIWFLCAIAFLKVSQKIDSFMASLGINVGNTGGNMMAELMIAGKSLSAAVSSHGGSIGRSLGGGYQKTASPGAAAVGDSFLSGGLAGAVGRQVERSAVNAATG
GUT_GENOME001016_00709	222-338	WVRMVGSQLFLMLCNVIFFRLFMMGLGSYDGLIETYNQQVEAKAGIMASYNKGTVVIVWVLMMHGILAIATRVDSYLNTLGLSAAQTGRGLAGALVAAGMGVRRTVSSIKSGAGKAY
GUT_GENOME122439_01060	5-149	MKYITGIVLSVLVICALTIPAFALTESDVQSQVSASGKEGVAGNLFVWFLCAVAFLKISQKIDSFMQGLGINVGHTGGSMLAEVMLAARSIAAARGVAGRGRSGNAGRAGSTGGSSGGGDSNTFLQGGLAGVVNRSFYNGAYKSA
GUT_GENOME260354_00030	2-148	KRRYKILILMIVVIAMVSFTTIPAFALTESEVQDQVNAVGKEAVTGNVFIWFLCAIAFLKVSQKIDSFMSSLGINVGHTGGSMMAELLIAARGIGAAKSFAGRNGGGGGSRSGSGSSSGGGSTFMRGGLSGVISRKFTNDATKRATG
GUT_GENOME030650_01325	181-278	GWLRMFASMCTLMALNVMFVKMLLSAMSNSPTGVAIVPWVMLITGIVRTAKKIDSIILRIGLNPASTGDPLGHHHIPGMLSALMFHHAAEFIKNTISN