UHGP-MC 114239

Information

Number of sequences (UHGP-50):: 152
Average sequence length:: 65±5 aa
Average transmembrane regions:
: 0
Low complexity (%):
: 0.7
Coiled coils (%):
: 0.17
Disordered domains (%):
: 0.1
Pfam dominant architecture:: PF08843
Pfam % dominant architecture:: 8882
Pfam overlap:: 0.17
Pfam overlap type:: shifted

Downloads

Seeds:: MC114239.fasta
Seeds (0.60 cdhit):: MC114239_cdhit.fasta
MSA:: MC114239_msa.fasta
HMM model:: MC114239.hmm

Sequences list (filtered 60 P.I.)

Protein	Range	AA
GUT_GENOME147999_00972	86-135	EKDWQTNHGNFIEAFLLFLNKQTDQFVLKGGTALSLCYGLDRFSEDIDLD
GUT_GENOME234651_00895	4-75	SKILIEKISHETGFIGSNIEKVIRLLDVLDFIFSKSSFQEKLVLKGGTAINLAYTNLARLSVDIDLDYHGSI
GUT_GENOME019128_00132	18-83	RVSESTHIPLAMVEKDFWVCFVLARIFSDAELRDALRFKGGTSLSKGYGLIKRFSEDLDLILDKSL
GUT_GENOME017802_00053	8-75	LIDEVSFETGIAPSYIEKDWYLVLTLSLLKELNTADTKVIFAGGTSLSKAFGLISRFSEDVDFSVVGN
GUT_GENOME201157_01193	1-75	MFSNANSFKAKIKNMAKDRGIPAQQLQQNFLIEQVLKLIAKSSYKDSFIVKGGYLIGQLIGLDKRTTMDLDVTLK
GUT_GENOME258425_00245	20-78	RRGIPAAVLEKDILLTDVLQAISEIRPRGFSLAFCGGTALAKAYKVIDRMSEDLDFKVT
GUT_GENOME008072_03072	13-84	KAIFIKAAFDIGIRPDMVEKDYWVSWTLNQLFADKKLGSIFLFKGGTSLSKAFHIIKRFSEDIDLLLDLGEV
GUT_GENOME014963_00387	14-77	ILIATSNALGIEMAIVEKDYYVSLLLKEINKNYPDIIFKGGTSLSKCYKIISRFSEDIDIGINA
GUT_GENOME193396_01131	19-80	VAPMMKMNEGIIEKDFYVVLILELLFHHSKFGKSFAFKGGTSLSKGYNIIKRFSEDIDLVMD
GUT_GENOME264202_02022	11-93	KALIFLTAKDMGILEFYIEKDYWVTYILKKLSSSSFKNDVVFKGGTSLSKGYNAINRFSEDIDLQLINSSLGDNQKKKLLKNI
GUT_GENOME101942_01933	4-77	DENKDLFSQAIRAASNELNIQTQYIEKDYWISLVLRQLSQCEYADMTVFKGGTSLSKGYGLISRFSEDVDVAIL
GUT_GENOME206088_00079	14-78	INQISKEKGINEAIIEKDYFVSLILQEIAKENGNIVFKGGTSLSKCFGLINRFSEDIDLSCERKL
GUT_GENOME147482_03435	13-75	VSDALELGNPSITEKDYWVVSLLAMLESVESEHHQLVFSGGTALAKSNIKILRMSEDVDIKLI
GUT_GENOME143396_03710	15-80	VEIIQATADHLSIPAVYVEKDYWVTYILRSLSRSDYKERLIFKGGTALSKAYKLIRRFSEDIDLAA
GUT_GENOME206760_00718	11-83	KQFVNKISIETNIAMDILEKDYYVCCILQELSKKQDELQAYFKGGTAIYKILDTMNRFSEDIDLTVKINEELS
GUT_GENOME171447_03651	24-87	AQQHPSGLGASFLEKDLWVTEILWLLFNEDLLGDLSVAFKGGTALSKCWNVIERFSEDIDLSVH
GUT_GENOME080362_03050	15-80	VLETAAQMLGRPAYVLEKDIYVVWALGRIFSAPIGNHLTFKGGTSLSKVYRLIDRFSEDLDLTYDV
GUT_GENOME238202_01287	12-80	RAQILQQIAIARHLDATAIEKDWWVTMCLTALFQCRCADYINFKGGTSLSKCWHLIDRMSEDIDIAVDR
GUT_GENOME081295_01935	12-75	EVIYSAATDLNLPIPVVEKDYYVTMLLKQLAEKAPACVFKGGTSLSKCHHAIDRFSEDIDIAFT
GUT_GENOME258542_01244	15-76	LLASEAMRIDSGIIEKDYYVTMFLKSLVARQPQILFKGGTSLSKCYRLIKRFSEDIDLNLVC
GUT_GENOME231809_01045	18-69	VDYSFVEKDWFITRALNALANDPDLVFSGGTSLFKAHRLIERFSEDIDFLVI
GUT_GENOME274086_00537	14-81	IRQYSLATGIPETFVEKDIYVLKVLSVLANINYPDITIAFSGGTCLSKAYNKIKRFSEDLDFCIQTSI
GUT_GENOME243880_00111	12-81	VLIEAIHQKTGYREDVLEKDYYVTLILKELAEKQAQGLPAYFKGGTALYKALKTTNRFSEDIDLSVDTKE
GUT_GENOME030984_01868	9-80	ELLRDIIVTVSERTGIDESIVEKDYYVTMILKELVQRNPDVVFKGGTSLSKAYHVIDRFSEDIDITFEEHLG
GUT_GENOME001710_01168	13-75	IIALAADHFGYEQSHVEKDYWVSKILRDISMSEYADKTYFKGGTSLSKAYGLIERFSEDLDLF
GUT_GENOME274569_00498	13-80	KALLLEVAHKANLEPHIVEKDFWVSWILGKIFSDKELNKILCFKGGTSLSKVFGLIERFSEDIDLILA
GUT_GENOME009424_02238	10-77	EWKEIIKTVAREQGRTELMVEKDTIQSMFLLELSKSELPFVFKGGTSLSKAYNLIDRFSEDIDLSMNR
GUT_GENOME152550_02612	12-79	TDILDRVSTELNIRQREAIEKDWWVTTVLRAIFSLPYAKHLSFKGGTSLSKCWHLIDRFSEDIDIAID
GUT_GENOME013746_01679	14-81	IIEAAKQVNLSEFIAEKDYWVTYLLKNLVKSEFANEFVFKGGTCLSKAYNLIERFSEDIDLLMIETDK
GUT_GENOME123726_01763	3-73	DLTKLFPDVADALGIESVAIVEKDHYIVELLRLLQPLSFDTHQLVFAGGTALSKAGISLNRMSEDVDIKLV
GUT_GENOME040205_00311	15-83	LFRNTADKMGLNDAIVEKDFWVCFTLDYLFHRCPWKDSITFKGGTSLSKAFNLISRFSEDIDLILDWRV
GUT_GENOME226900_03524	26-82	ELSTGNICHERWGRYCVTMLLKPLSEKIPYIVFKGDTSLSKCHKVIKQFSEEIDITI
GUT_GENOME225930_03613	25-106	NGLPAFVAEKDVHVTDALRVLASLHIVHEAKLKGFDPRSKKVPNEPINIDLPVRFVFAGGTCLSKAYNLINRMSEDIDIKVI
GUT_GENOME096544_00821	13-75	AERFGVEMEQVRRDHLVSHVLGAIASGVPTDDIVFFGGTALSRTHLADARLSEDIDLIALAPR
GUT_GENOME100290_00659	13-77	AIQATSQELGMAQEFVEKDYWICQILQSLSRHPLNERIVWKGGTSLSKAYGLIRRFSSDVDFAVL
GUT_GENOME143619_01167	21-81	ARHFGKNSIVLEKDIWVCWVLKQIFEMPNRLSMAFKGGTSLSKIYKVIDRFSEDIDITLDY
GUT_GENOME152049_00921	4-71	NYKKNIEKIAVRTGFIRSTLEKVERLLDILEWINNHEKLGRLLALKGGTAINTVIFNFPRLSIKTRLL
GUT_GENOME030734_01113	13-72	QVPWTETEQVEQDLLICRALTEIYKDPYLASHLAFRGGTALHKLFLSPQPRYSEDIDLVQ
GUT_GENOME278959_00714	13-78	ELIKIVSDEKHIPEDAVLMDYYIVYMLEKLSNSEYKDLCVFKGGTSLSKCYPESIERFSQDIDLTY
GUT_GENOME188454_02054	12-77	ELIRLASAHFKIVPAFIEKDYWITHVLKQLSNYQDANHVVFKGGTSLSKGYHLINRFSEDIDLAMM
GUT_GENOME095248_01152	11-77	FDQLLSVVADERGVDPVLVEKDYWIMHCLWGLQAQGFQFELKGGTSLSKGFGVIHRFSEDIDIRIEP
GUT_GENOME237448_00227	11-81	EITEVIEATSRKSGLASSIVEKDLWVCYILYYLFNRCDYKDYFEFKGGTSLSKAYDLIDRMSEDIDIVLNS
GUT_GENOME048404_00203	13-70	RKEPNPEMAEKDYLECLILDKLFSDAYICDNFVFAGGASLSKSYRMTNRIGQDIDLVC
GUT_GENOME126618_01633	13-77	VLLGTAAEFSMSEEFVAKDYWAMMMLAEAMKRSETLVFKGGTCLSKCYGVISRFSEDVDLGIPYE
GUT_GENOME227920_01300	12-76	KRLVNNTATQYGLRPDEVVKDYFMMLVLQQIVKIDPSIILKGGTSLSKGYGITNRFSEDLDLAVS
GUT_GENOME095248_01135	10-81	ELIEALVAEAAPGGITAGLLEKDEYLTDALRALFALQPEGMQLVFCGGTSLSKAYGLIERMSEDADLKVVIP
GUT_GENOME239314_01233	10-74	RQVIEGTAKELQMSRAIVEKDYYVTALLAEISKRTPDLVFKGDTSLSKCYKIIQRFSEDIDLNLS
GUT_GENOME267159_00796	25-98	LDVLEITSAKTHLPQLAVEKDWWVTMVLKALSATQHFELMSFKGGTSLSKGWNLINRFSEDIDIAMRREGKFSI
GUT_GENOME015476_00228	12-78	LQALSEELAIDPAFLEKDWYATHALQLLQETTDTTFECIFSGGTCLSKAYHLIKRFSEDLDFRVQGA
GUT_GENOME158444_00773	13-76	LVIQTAAFKHIPQNAVIKDYMICSILQKLSKSEYVNKCIFKGGTSLSKCYEGAIDRFSEDIDLT
GUT_GENOME047929_00670	6-78	KRLALMQTAVKVGLPVEAVEKDLWVTAILQAVFSLPYSKMFVFKGGTSLSKVWKRIERFSEDIDLAIDRCQFK
GUT_GENOME096279_05065	22-90	SHPLGYPAYIIEKDFWVTQTLLAIYNHFAPSLSEKSKFPFIFKGGTSLSKCYGIINRMSEDIDLSIALD
GUT_GENOME252374_01226	15-80	LFRHIGEQLGITPSIVEKDFLVCRVLQILFGEESLSPYLCFRGGTSLSKAYKVIRRFSEDIDIALS
GUT_GENOME027519_00580	15-80	VVRTANALGLTTSFVVKDYFIFEMLRSIVGINPSVVFKGGTSLSKCHHVIDRFSEDIDLGLEVEHA
GUT_GENOME096089_01258	6-70	NIADSYAFELGNTKDAVIKEILHYDILQSLSQSDIANDIVFQGGTSLRLCYGNNRHSEDLDFALK
GUT_GENOME138244_01289	10-75	EHLHDLHSQYSRKVDIHILERTVFAFGLLEALARTGLPFIFKGGTSLILLFGTLKRLSTDIDITVS
GUT_GENOME018727_00455	9-76	DFTEAVQAVSRGLNISPALVEKDYYVTLVLKRLNEELSGLIFKGGTSLSKCHKAINRFSEDIDLTLDS
GUT_GENOME285286_01626	15-87	IVQNTALRTNIEDLAIEKDWWVTITLKALFSTSFSEFLLFKGGTSLSKGKWENIDLRRFSEDIDISLSRSWFT
GUT_GENOME238010_00850	15-92	AMLQQTEVGHPGVNQVAIEKDWWVTVTLKALFQTDCRDSLIFKGGTSLSKGFNIIERFSEDIDLAINHSFFGIEGTSK
GUT_GENOME213065_00695	4-71	EDLRMLFAQVASTSGFPQHLIEKDYWLTRILSKVGYLSPDLVFKGGTCLNKIYFDYFRLSEDLDFIML
GUT_GENOME220728_01192	17-81	LKTSEATGKSVAIVEKDYWISYLLDYLFAKSSFNDMLVFKGGTSLSKGFNLINRMSEDIDLILNW
GUT_GENOME207623_06052	7-72	ILAVAQQTSLTPHVVEKDYVLGWMLAGIYEHEELAESWIFKGGTCLKKCFFETYRFSEDLDFTLTK
GUT_GENOME103696_01710	13-75	VLAGAAGFLGIHDAIIEKDYYVTLILRILAKNVEEAVFKGGTSLSKCHHVISRFSEDIDIGFV
GUT_GENOME257279_00023	13-78	LLILNCAEKMGVPPAFVVKDYYITMLLKEVTSSNPSACFKGGTSLSKSHHIINRFSEDVDLGMERE
GUT_GENOME243070_01650	20-85	FDTTALRLGTASQNVEKDFWVCWTLDALFNGLKEGGPRLLFKGGTSLSKGFGLINRFSEDVDVTVF
GUT_GENOME001937_01113	20-82	KAAEGTTLPPQAIEKDWWVTKVLQAIRSLDYRDSVQFKGGTSLSKGWGLISRFSEDVDLSIDR
GUT_GENOME070821_00108	8-75	ELIEEVAAEMGVNPSFVEKDWYAVQILKAIAPVKFPAPVIFTGGTSLSKGFSLIKRFSEDLDFKVSGG
GUT_GENOME130359_01785	11-78	FKEAAARTAEDTGFVAEAVEKDYYVSMILRGISESLPFSVFKGGTSLSKCYGVIKRFSEDIDLTTDIP
GUT_GENOME188911_03182	20-84	IESISKKKKVDKILIEKVIRALMLLEGLSSSGLDFVFKGGTALMLLLGTTKRLSIDIDIIVPNKS
GUT_GENOME244130_01369	18-74	FQRVFGVGPNQIHHDFIVSHVLDLLRMHKDELLFAGGTALARTYLKSHRFSEDIDLW
GUT_GENOME070503_01582	13-74	IINEISFEKKISTGIIEKDYYVTYFLKELLAIDKNFIFKGGTSLSKGFKIIERFSEDIDLNY
GUT_GENOME030105_01326	6-76	NKENFQEMIELVSTDTGRAAAVIEKDYYVTLILRLLSEQLSNVVFKGGTSLSKGYHAINRFSEDIDITFDE
GUT_GENOME007828_00223	11-73	EELVVAASNELAISANVIEKDYYVTLILKAISEQMKDIVFKGGTSLTKCYQLLERFSEDIDLS
GUT_GENOME022812_00113	11-80	EQTILQVAQKSGIEAGIIEKDYYVTLLLRELTNALPSMIFKGGTSLSKCHKVIKRFSEDIDITLDENHLT
GUT_GENOME057382_01434	17-85	ASRPTTDGGLGISPLFIEKDYWVSRSLKLMAEHDKDGRAVFKGGTSLSKAYGIGARFSEDIDVAISDAW