• Disorder
  • Domain
  • PTM
  • Variation
  • Mutation
  • Interaction
  • Disease
  • Drug
  • Physicochemical
  • Function
  • Proteomics
  • Structure
  • Localization
  • Expression
  • Element
  • Methylation

LLPS-Tar-a090
LOC101079376

Integrated Annotations

▼ OVERVIEW


Status: Unreviewed
Protein Name: Uncharacterized protein
Gene Name: LOC101079376
Ensembl Gene: ENSTRUG00000005142.2
Ensembl Protein: ENSTRUP00000012315.2
Organism: Takifugu rubripes
Taxa ID: 31033
LLPS Type: Client


▼ Classification


Condensates:
CondensateEvidenceOrthologs
Postsynaptic densityPredicted from orthologs(View)

▼ CROSS REFERENCE


DatabaseNucleotide IDProtein ID
EnsemblENSTRUT00000012375.2ENSTRUP00000012315.2
UniProtH2SIT3, H2SIT3_TAKRU
Entrez101079376

▼ SEQUENCE


Protein Sequence (FASTA)
1     MASQQDSGFF  EISIKSLLKS  WSSSSPVGNG  YSKPPVPPVC  CPQGEKGPPA  MIPISIDPES  60
61    KPGEYVLKSL  FANFTTASER  KIRIIMAEPL  EKPLTKSLQR  GEDPHFDQLI  STMSSLAEYC  120
121   LPSILRTLFD  WYKRQNGLEE  DVHEYRPRAN  TKSKNDEQQR  DYLLERRDLA  IDFIFSLVLI  180
181   EVLKQIPLHP  VLDSLVNEVI  TLAFKHFRYK  EGYHGPNTGN  MHTVADLYAE  VIGVLAQSKF  240
241   PAVKKKFLTE  LKELRQKEQS  PAVVQSTISL  IMGLKFFRIK  MYPVEDFEAS  FQFMQECAQY  300
301   FLEVKDKDIK  HALAGLFVEI  LVPVAAAVKN  EVNVPCLRNF  VDSLYDTTLD  LSSRKKHSLA  360
361   FYPLVTCLLC  VSQKQFFLNR  WHVFLNNCLS  NLKSRDPKMA  RVALESLYRL  LWVYMVRIKC  420
421   ESNTATQSRL  NTIVTTLFPK  GSRSVVPRDM  PLNIFVKIIQ  FIAQERLDFA  MREIIFDLLC  480
481   VGKPAKAFSL  NPERMNIGLR  AFLVIADKRQ  QKDGEPPMPN  TGCTLPSGHT  LRVKKTYLSK  540
541   TLTDEEAKVI  GMSQYYFHVR  KAIDNILRHL  DKEVGRCMMM  TNAQMLNKEP  EDMITGERKP  600
601   KIDLFRTCVA  AIPRILPDGM  SKPELIDLLS  RLTIHMDDEL  RLIAQNSLQS  LLVDFSDWRD  660
661   DVLFGFTNFL  LREVQDTHQG  LLDTSLKLLL  QLLTQWKITA  AAPGKKHDGA  KVHTCEVHNS  720
721   VLKVPAERGP  HSTVLHAVEG  LSLVLLCSCQ  LTTRRLAVSI  LKEIRSLFMA  IKPSEDDDKP  780
781   MIEIMDQLSP  VILESFVGVA  ISDTASLPVG  HHIDLQWLVE  WNALLVNSQH  DIRSPSHVWI  840
841   FAQSVKDPWV  LCLYSLLRQD  NLPKHCSTAL  SYAWPYAFTR  MQMLMPLVDP  NTPLYAKKTG  900
901   TSGSGDNYIT  LWRNYLILCF  GVAKPSIMSP  GHLRASTPEI  SATPDGTSSY  DNKVIGSPSV  960
961   AWLLKQLVPL  MRAEGIELTE  SLVLGFGSAN  SLVFRELVEE  LHPLMKEALE  RRPENKKRRE  1020
1021  RRDLLRLQLL  RIFELLADAG  VVSDSTNGAL  ERDSLAMGAL  FLEYMDLTRL  HLEVENDKDA  1080
1081  EILKDIRAHF  SAMVANLIQC  VPVHQRRFLF  PQQSLRHHLF  ILFSQWAGPF  SIMFTPLDRY  1140
1141  SDRNHQITRY  QYCALKAMSA  VLCCGPVFDN  VGLTPDGYLY  KWLDNILVHQ  LGCEVVILLL  1200
1201  ELNADQINLF  NWAVDRCYTG  SKQLASGCFK  AIAAVCSSSR  NYASDIVTLL  NLVLFKASDT  1260
1261  NRETYEISMQ  LMQILEAKLF  AHSKRVAEQK  PSCILYGTHG  PLPPLYSVSL  PQLSSQLATM  1320
1321  YPELTLPLFS  EISQRFPTSH  TNGRQIMLTY  LLPWLSNIEL  VESGLLLPAF  PPSHSDYNPS  1380
1381  SHTFDTGSSH  QLKGNGWGSL  QATSLVLNNL  MFMTAKYGDD  LPGPEMENAW  NALVSNQKWS  1440
1441  NNLRTTLQFL  ISLCGVSSDT  TLLPYIKKVV  IYLCRNNTMQ  TMEELIFELQ  QTDPVNPVVQ  1500
1501  HCDSPPFYRF  TATNKVTIAA  SGTTSSSNTV  VAGQENFLGT  DDVKIVKENE  ERLSHMMRAH  1560
1561  NRLESRYSNS  SGGSYDEEKS  EPLPPYADWL  MRVIETNQPQ  PLPMPLNGGC  WAPLVDFLPE  1620
1621  TAAPRGPLHR  CNIAVIFMTE  MVVDHGVRED  WTMHLPLLLH  VILRYKDKCM  DHYRPEVFEH  1680
1681  CKRLLLHLLI  TLSCNNNLQA  IASVLLQTRE  VNGTKTLTCK  PGPQLDYLSS  GGTFDFLREC  1740
1741  QASPVPDSGL  SSSSTSSSLS  LGGSINNLPE  ITHEVDELVS  PNKIDEKTNK  LIEFLTTSRT  1800
1801  YGPLWCHEDI  SPKNQTSKST  GQLTNFLRHV  VSVFKESKSD  FNLEQQLSDV  ALQTALCSSS  1860
1861  RHYAGRSFQV  FRALRQPMCA  HAVSVLLSRL  VEVVGEHGEE  VQGYVLELLL  TLEFVVDNLA  1920
1921  ECLKNNDLMA  ALTRATSPDF  LTSIKMLSNR  ESTGQLGLRR  EDRSGHQRSS  SVPKKFGRAD  1980
1981  RGSDPPRSAT  LDRIQVCEQQ  VLLAKSHSSS  SSKDNVSDPA  SVNHPSNLLA  TIFWVAVSLM  2040
2041  ESDFEFEYQM  SLRLLNKLLG  HMTLDKAENR  EKLEKLQNQL  KWSSFTGLQQ  LLLKGFTSVS  2100
2101  TTDLTLHLLC  QLTPVSRVPV  VDTSQVIGFP  LNVLCLLPHL  VQNFDSPSQF  CQDAAERIAQ  2160
2161  VCLEEKNAKL  SNLAHVMTLY  KTHSYTRDCS  SWVNVVCRYL  HEAFSDITLS  LVTYMAELLD  2220
2221  KGLPSMQQTL  LQIIYSLLSH  MDLSGIQAKT  FNMEVLKTIE  KYVQTVHWGE  ALNILKLVVS  2280
2281  RSASLVQPSA  PQSDLSYEDV  SRVWDRCSKA  LPGKTLDFHF  DISETPVIGR  RYDELQRAAG  2340
2341  QDVRSRTTEV  TRSTSSTSSG  STTNNVLVPV  SWKRPQSSQK  RTREKLVNVL  SLCGQEVGLT  2400
2401  KNPSVIFSSC  GELDLMEHQP  SLVSSDEGTR  DPDTMDDNTS  EQQFRVFRDF  DFLDVELEDG  2460
2461  EGETMDNFNW  GVRRHSVDSL  DRSDLLPLEE  NQLSSSLPIL  SKLTHEDSDE  SSEEDSLSAS  2520
2521  QILSNSQLVN  IPFIVPQWFH  NRVSQEDGDT  SAQEDDLSLS  ISELQLEFHC  SDALAEEERD  2580
2581  DLLESRSSPP  PSPFFSAILA  AFQPTVCDDA  EEAWRSHINQ  LVADSDGSCA  AYTFHVFSSL  2640
2641  FQSIQKKFYS  LTSDAVSYLG  DGLRGLGSKL  LRSSQMLASC  SECPTLFIDA  DTIMSYGLLE  2700
2701  KMKFSALELQ  EYLDTYNNRK  DAALSWLNNC  KATFPRSPGG  TVMACHSVAQ  EEKQLELCQR  2760
2761  LYKLHFQLLL  LFQSYCKLIE  HIHAISSIPE  LTNMSRELSE  LKSNLRLAAA  SLANNDIDTH  2820
2821  ESSCPEPTFT  SAEAAVQAIL  ECLKNDGLLM  AVHYIRECRT  VWPNDIFGSC  SDDEAQTLLH  2880
2881  IYFRHQTLGH  TGTFALVGPK  QDLTEISIKL  MELNGEIRDM  IRRAQGYKAI  TAFLPDSRVS  2940
2941  GSTL  2944
Nucleotide CDS Sequence (FASTA)
1     ATGCCGAACA  CTGGCTGCAC  TTTACCCTCC  GGGCACACTC  TACGAGTGAA  GAAGACATAT  60
61    CTGAGCAAAA  CACTGACCGA  CGAGGAGGCT  AAAGTCATTG  GAATGTCACA  GTATTATTTT  120
121   CATGTGAGAA  AAGCTATCGA  CAACATCCTC  CGACACCTGG  ACAAAGAGGT  GGGCCGCTGC  180
181   ATGATGATGA  CTAATGCTCA  GATGCTCAAC  AAAGAGCCGG  AGGATATGAT  TACAGGTGAA  240
241   AGGAAGCCCA  AAATCGATTT  ATTCAGGACG  TGTGTTGCTG  CCATTCCTCG  CATCCTGCCT  300
301   GATGGGATGT  CCAAACCAGA  ACTCATAGAC  CTACTGTCAC  GGTTGACGAT  CCACATGGAT  360
361   GATGAGCTGC  GGCTCATAGC  CCAGAATTCC  TTGCAGAGTC  TGTTGGTGGA  TTTTTCTGAC  420
421   TGGCGTGATG  ACGTTCTGTT  TGGATTCACA  AACTTCCTGT  TACGTGAGGT  CCAAGACACC  480
481   CACCAGGGAC  TGTTAGATAC  ATCCCTCAAA  TTACTACTGC  AACTGCTCAC  ACAGTGGAAA  540
541   ATAACAGCGG  CCGCCCCAGG  GAAGAAGCAC  GACGGTGCTA  AATTGCTGCA  GAGCAGCTCC  600
601   AGTCTCAAGG  TACCTGCAGA  ACGTGGTCCC  CACTCCACTG  TGCTGCATGC  TGTGGAGGGC  660
661   CTGTCGCTTG  TTCTGCTCTG  CTCCTGTCAA  CTCACCACCC  GCAGACTCGC  CGTTTCCATT  720
721   CTCAAAGAGA  TACGAAGCCT  TTTCATGGCC  ATTAAACCAT  CTGAGGATGA  CGACAAACCG  780
781   ATGATAGAGA  TCATGGACCA  GCTCAGCCCT  GTGATCCTGG  AAAGCTTTGT  CGGTGTTGCC  840
841   ATCTCTGACA  CAGCTTCTCT  GCCGGTTGGC  CACCACATAG  ATCTCCAGTG  GCTGGTGGAG  900
901   TGGAACGCCC  TGCTTGTCAA  CAGTCAACAT  GACATTAGGA  GTCCCTCTCA  TGTGTGGATC  960
961   TTTGCACAGT  CTGTGAAAGA  CCCCTGGGTG  CTTTGCCTTT  ACAGTCTCCT  CCGACAGGAC  1020
1021  AACCTGCCCA  AACACTGCTC  CACAGCTCTC  AGCTACGCCT  GGCCTTACGC  CTTCACTCGA  1080
1081  ATGCAGATGC  TCATGCCCCT  TGTTGATCCA  AATACTCCAC  TGTACGCTAA  GAAGACCGGC  1140
1141  ACTTCAGGCA  GTGGAGACAA  TTACATAACC  CTGTGGAGAA  ACTACCTAAT  CCTTTGTTTT  1200
1201  GGGGTTGCCA  AGCCAAGTAT  CATGAGCCCT  GGCCATCTGA  GAGCATCGAC  ACCTGAGATC  1260
1261  TCGGCCACAC  CCGATGGCAC  CAGCAGCTAC  GATAACAAGG  TTATCGGGAG  CCCATCTGTA  1320
1321  GCTTGGCTTC  TGAAGCAGCT  GGTTCCACTG  ATGAGGGCAG  AGGGCATTGA  GTTGACAGAG  1380
1381  TCATTAGTTC  TGGGGTTTGG  TTCTGCCAAC  TCCCTTGTAT  TCAGGGAACT  TGTGGAAGAG  1440
1441  CTACATCCCC  TCATGAAAGA  AGCTTTAGAA  AGAAGGCCGG  AGAACAAGAA  GCGTCGCGAA  1500
1501  CGGCGAGACC  TGTTGAGACT  CCAGCTTCTG  CGCATCTTTG  AGCTGCTGGC  TGATGCAGGC  1560
1561  GTCGTCAGTG  ACAGCACCAA  CGGAGCTCTG  GAACGTGACA  GTCTCGCCAT  GGGCGCTCTG  1620
1621  TTCCTGGAAT  ACATGGATCT  GACGCGGCTG  CACTTGGAAG  TTGAGAATGA  CAAAGATGCC  1680
1681  GAAATCCTCA  AGGATATAAG  GGCTCACTTC  AGCGCCATGG  TGGCGAATCT  CATCCAATGC  1740
1741  GTTCCAGTGC  ACCAGAGACG  CTTCCTGTTT  CCACAGCAGA  GCCTGCGACA  TCACCTCTTC  1800
1801  ATTCTCTTCA  GCCAATGGGC  CGGCCCCTTC  AGCATCATGT  TCACCCCTCT  GGACCGCTAT  1860
1861  AGTGACAGGA  ATCACCAGAT  CACAAGATAT  CAATACTGCG  CCCTAAAGGC  AATGTCTGCT  1920
1921  GTGCTGTGCT  GCGGGCCTGT  CTTTGATAAT  GTCGGCCTGA  CTCCAGATGG  ATACCTCTAT  1980
1981  AAGTGGCTGG  ATAATATATT  AGCCCTGCCA  GGATGTTCGG  GTCATGATGT  TCATCAGCTT  2040
2041  GGCTGTGAAG  TCGTCATCCT  CCTCTTGGAG  CTCAACGCCG  ACCAGATCAA  CCTTTTCAAC  2100
2101  TGGGCTGTGG  ATCGCTGCTA  CACAGGCTCC  AAACAGCTCG  CCTCGGGCTG  CTTCAAGGCA  2160
2161  ATCGCAGCAG  TCTGTAGCAG  CAGCAGGAAC  TACGCAAGTG  ACATCGTCAC  ACTGCTGAAT  2220
2221  CTGGTCCTCT  TCAAGGCATC  GGACACCAAC  AGAGAAACTT  ACGAGATTTC  AATGCAGCTT  2280
2281  ATGCAGATCC  TGGAAGCTAA  ACTGTTTGCA  CACTCTAAGA  GGGTTGCAGA  GCAGAAGCCA  2340
2341  AGCTGCATCC  TGTATGGCAC  TCACGGACCC  CTGCCTCCTC  TGTATAGCGT  GTCTCTGCCA  2400
2401  CAGCTTTCCA  GCCAACTGGC  AACAATGTAT  CCTGAACTCA  CACTTCCGCT  ATTCTCAGAG  2460
2461  ATTAGCCAGC  GGTTCCCCAC  CTCTCACACC  AATGGGAGGC  AGATCATGCT  GACTTACCTC  2520
2521  CTGCCTTGGC  TCAGCAACAT  CGAGCTCGTG  GAAAGTGGCC  TGCTGCTGCC  GGCCTTCCCG  2580
2581  CCATCCCACT  CAGATTACAA  CCCCTCTTCC  CACACCTTTG  ATACAGGTTC  ATCCCACCAG  2640
2641  CTGAAAGGCA  ACGGCTGGGG  CTCCTTACAG  GCCACATCTC  TGGTGCTCAA  TAACCTCATG  2700
2701  TTCATGACAG  CCAAGTATGG  AGACGACCTT  CCCGGTCCAG  AGATGGAGAA  CGCCTGGAAT  2760
2761  GCTTTGGTCT  CTAATCAGAA  GTGGAGCAAC  AACTTGAGAA  CCACGCTGCA  GTTTCTCATA  2820
2821  AGTTTATGCG  GTGTGAGCAG  CGACACCACC  CTCCTACCAT  ACATCAAGAA  GGTGGTTATC  2880
2881  TATCTGTGCC  GGAACAACAC  TATGCAAACT  ATGGAGGAGT  TGATATTCGA  GCTACAACAA  2940
2941  ACAGATCCGG  TCAACCCAGT  TGTGCAACAC  TGTGATAGTC  CTCCCTTCTA  CCGCTTCACA  3000
3001  GCAACAAACA  AGGTCACCAT  AGCAGCTTCT  GGTACTACAT  CCAGCAGCAA  TACAGTTGTT  3060
3061  GCAGGTCAGG  AGAACTTTCT  TGGCACAGAT  GATGTCAAGA  TTGTAAAGGA  GAATGAGGAG  3120
3121  AGATCAAGAC  TGAAGATCTT  TTTGTCTGAC  CCCAGGCTAA  GCCACATGAT  GCGAGCCCAC  3180
3181  AACCGCCTCG  AGTCACGCTA  CAGC  3204

▼ ORTHOLOGY


DrLLPS IDOrganismIdentityE-valueScore
LLPS-Hos-a102Homo sapiens0.04447undefined
LLPS-Mum-a105Mus musculus0.04439undefined