• Disorder
  • Domain
  • PTM
  • Variation
  • Mutation
  • Interaction
  • Disease
  • Drug
  • Physicochemical
  • Function
  • Proteomics
  • Structure
  • Localization
  • Expression
  • Element
  • Methylation

LLPS-Thc-1934
TCM_022174

Integrated Annotations

▼ OVERVIEW


Status: Unreviewed
Protein Name: EIN2-like protein, nramp transporter isoform 1
Gene Name: TCM_022174
Ensembl Gene: TCM_022174
Ensembl Protein: EOY07852
Organism: Theobroma cacao
Taxa ID: 3641
LLPS Type: Client


▼ Classification


Condensates:
CondensateEvidenceOrthologs
P-bodyPredicted from orthologs(View)

▼ CROSS REFERENCE


DatabaseNucleotide IDProtein ID
EnsemblEOY07852EOY07852
EnsemblEOY07851EOY07851
UniProtA0A061ESN9, A0A061ESN9_THECC
GeneBankCM001883EOY07851.1, EOY07852.1

▼ SEQUENCE


Protein Sequence (FASTA)
1     MEAEMGNANH  KPAALHRLLP  AVLPVLLISI  GYVDPGKWVA  TVDGGARFGF  DLVGPMLLFN  60
61    FAAILCQYLS  ARIGVVTGKD  LAQICNDEYD  KATCIFLGVQ  AELSVLLLDL  TMVLGVGHGI  120
121   NLLFGVDLST  GVFLAALDAL  LFPVFATLLD  HCRASFLCMY  AVGFILLSYI  SGVLISQPEI  180
181   SLSMTGMLTK  LSGESAFALM  SLLGASIMPH  NFYLHSSFVQ  RHQGPPNISK  SALCHDQLFA  240
241   ILCIFSGIYL  VNYVLMNSAA  NVFYSAGLVL  VTFQDAMSLM  EQVFRSGVLP  LVFLLIMFLS  300
301   NQITASTWNL  GGHVVLHDFL  GLDIPGWLHC  ATIRIIAMVP  ALYCVWTSGA  EGIYQLLIFT  360
361   QVMVALLLPS  SVIPLFRIGS  SRPIMGVYKI  SPIVEFLALL  TFMGMLGLKI  IFVVEMIFGN  420
421   SDWVGNLRLN  AGISMSVPFV  VLLVTACASF  SLMLWLAATP  LKSATARIDA  PAWKWDLNRT  480
481   VPEAAIEGEE  SGLSETRYHG  EEPVHRQESS  STPGKSIESH  SDLSFTNYDL  DLPETIMESD  540
541   QDIPLTTVIE  NSSNSLYPSP  AVRNPEESAS  IIESAATLVN  EVADDELPGT  KTVTIESMNP  600
601   VEKTVSLEGD  LQIEKDDDDG  DTWEPEEPSK  PPSGSISSLT  PDGPPSLRSL  SGKSDDGGNG  660
661   TGSLSRLAGL  GRAARRQLAA  ILDEFWGQLY  DFHGQPTQEA  KIRKLDVLLG  VDTKPMKVDT  720
721   AGKECGGYFP  SVGGRGSDLL  ISSSLYDSPK  QLKVRNSIDL  PYGYSRGSSS  SWSNNRQLLD  780
781   AYVQTSSRNV  DSGEKRYSSL  RAAPSTDAWD  YQPATVHGYQ  IASYLSRIAK  NRSSDCLNGQ  840
841   MELPASKSPA  LGPINYRDPL  AFTLGQKLQN  GITPVQAPGF  QNVAVSRNSP  LQSERSYYDI  900
901   SSLGPNDNSV  ISVNSKKYHS  LPDISGLSVP  HRDSYMSDRS  AQWDSSIGYG  SSVGRTNYDT  960
961   PMYPNTGSRA  GVPLAFDELS  QSKGYKDAFS  FQLSSSPDTG  SLWSRQPFEQ  FGVAEKRRTA  1020
1021  GSEAFGSGLN  SEARDTASGE  DLESKLLQSF  RDCIVKLLKL  DGFDWLFRQN  DGADEDLIDR  1080
1081  VAARERFVYD  AEAREINQVA  HLGEPQYLSS  ERRYGSTPIR  DKANLVNFSI  SSFPHCGEGC  1140
1141  IYKADLVISF  GVWCIHRILD  LSLMESRPEL  WGKYTYVLNR  LQGVIDLAFS  KPRTPMTPCF  1200
1201  CLQIPVEYQQ  RSSPPISNGM  LPPAAKPGRG  KCTTAATLLE  KIKDVEIAIS  CRKGRTGTAA  1260
1261  GDVAFPKGKE  NLASVLKRYK  RRLSNKPFGT  HEGSGSRKVP  TSTPVLASYS  S  1311
Nucleotide CDS Sequence (FASTA)
1     ATGGAAGCTG  AGATGGGGAA  TGCTAATCAC  AAACCAGCTG  CTCTTCATCG  GCTGCTTCCT  60
61    GCTGTTTTAC  CTGTTCTTCT  AATATCAATC  GGATATGTTG  ACCCTGGAAA  GTGGGTTGCA  120
121   ACTGTTGACG  GAGGTGCACG  TTTTGGTTTT  GATCTGGTAG  GCCCCATGCT  TCTTTTTAAT  180
181   TTTGCCGCCA  TTTTGTGTCA  GTACCTGTCA  GCTCGAATTG  GCGTTGTCAC  TGGAAAAGAT  240
241   CTTGCTCAGA  TTTGCAATGA  CGAGTATGAT  AAGGCCACTT  GTATATTCTT  AGGAGTTCAA  300
301   GCAGAGCTTT  CTGTTCTTTT  GTTGGACCTT  ACCATGGTTT  TGGGGGTTGG  ACATGGGATT  360
361   AATCTTCTCT  TCGGGGTGGA  TCTATCCACT  GGTGTTTTTT  TAGCTGCTCT  TGATGCTCTT  420
421   TTATTCCCAG  TTTTTGCCAC  CCTCCTGGAC  CACTGCAGGG  CAAGTTTCCT  ATGCATGTAT  480
481   GCAGTGGGCT  TCATATTGCT  TTCTTATATT  TCTGGAGTGC  TTATCAGTCA  ACCAGAAATT  540
541   TCTCTTTCCA  TGACTGGGAT  GCTGACAAAG  TTGAGTGGGG  AAAGTGCATT  TGCCCTGATG  600
601   AGTCTCCTTG  GAGCAAGCAT  TATGCCTCAC  AATTTTTATC  TACATTCTTC  TTTTGTCCAG  660
661   CGGCATCAGG  GACCACCAAA  TATTTCTAAG  AGTGCCTTGT  GTCATGACCA  GTTATTTGCC  720
721   ATCTTATGCA  TCTTCAGTGG  TATTTATCTA  GTAAATTATG  TGCTGATGAA  TTCAGCTGCA  780
781   AATGTATTCT  ACAGTGCAGG  CCTTGTCTTG  GTTACTTTTC  AGGATGCAAT  GTCACTAATG  840
841   GAACAGGTAT  TTAGGAGTGG  TGTACTGCCC  TTAGTCTTTT  TGCTGATTAT  GTTCTTATCT  900
901   AATCAAATCA  CTGCATCAAC  CTGGAATCTT  GGTGGGCATG  TTGTCTTGCA  CGATTTCCTT  960
961   GGTCTTGACA  TACCAGGTTG  GCTTCATTGT  GCAACAATCA  GAATTATAGC  AATGGTCCCA  1020
1021  GCCCTTTATT  GTGTGTGGAC  TTCCGGAGCT  GAAGGGATAT  ATCAGTTGCT  TATCTTCACT  1080
1081  CAGGTTATGG  TAGCTCTTCT  GCTTCCATCT  TCAGTGATCC  CCCTGTTCCG  GATTGGCTCG  1140
1141  TCAAGACCAA  TTATGGGTGT  CTATAAGATT  TCTCCAATTG  TGGAGTTCCT  AGCGCTGTTA  1200
1201  ACGTTCATGG  GGATGCTGGG  CTTGAAGATA  ATTTTTGTGG  TAGAAATGAT  ATTTGGCAAC  1260
1261  AGTGATTGGG  TTGGTAATTT  GAGATTGAAT  GCTGGGATTA  GCATGTCTGT  TCCTTTTGTT  1320
1321  GTTCTTCTTG  TTACTGCTTG  TGCATCATTT  TCTTTGATGC  TTTGGCTAGC  GGCTACTCCT  1380
1381  TTAAAATCTG  CTACTGCCAG  AATTGATGCA  CCTGCATGGA  AATGGGATTT  GAATAGAACT  1440
1441  GTTCCTGAGG  CAGCTATAGA  GGGGGAGGAA  AGTGGTTTAA  GTGAAACTAG  ATATCATGGA  1500
1501  GAAGAACCTG  TTCATAGGCA  GGAAAGTTCA  TCAACACCAG  GGAAGTCTAT  TGAGAGTCAT  1560
1561  TCAGATTTAT  CTTTTACAAA  CTATGATCTG  GATTTGCCTG  AAACAATTAT  GGAGTCTGAC  1620
1621  CAGGACATAC  CTTTGACTAC  TGTTATTGAG  AACTCTTCGA  ATAGTCTATA  TCCTAGCCCC  1680
1681  GCGGTTCGTA  ACCCAGAGGA  GTCAGCATCC  ATAATTGAGT  CAGCTGCAAC  TCTAGTTAAT  1740
1741  GAGGTAGCAG  ATGATGAATT  GCCAGGCACT  AAGACGGTGA  CAATTGAATC  AATGAACCCT  1800
1801  GTGGAGAAAA  CAGTGAGTTT  AGAGGGAGAT  CTGCAGATTG  AAAAAGATGA  TGATGATGGA  1860
1861  GATACTTGGG  AGCCTGAAGA  GCCATCCAAA  CCTCCTTCTG  GAAGTATTTC  CTCTTTGACA  1920
1921  CCAGATGGCC  CTCCTTCATT  GAGGAGCCTC  AGTGGGAAAA  GTGATGATGG  AGGGAATGGT  1980
1981  ACTGGGAGTC  TCTCTAGATT  AGCAGGATTA  GGTCGTGCTG  CAAGGCGTCA  ATTAGCTGCC  2040
2041  ATTCTTGATG  AATTTTGGGG  GCAATTGTAT  GATTTTCACG  GGCAACCTAC  CCAAGAAGCA  2100
2101  AAGATAAGGA  AACTAGATGT  GTTATTAGGT  GTTGATACAA  AGCCAATGAA  AGTGGATACT  2160
2161  GCTGGGAAGG  AATGTGGTGG  GTATTTCCCT  TCGGTAGGAG  GAAGAGGATC  TGATCTGCTC  2220
2221  ATTAGTTCAA  GTCTGTATGA  CTCCCCAAAG  CAACTAAAGG  TGCGAAATAG  TATTGATTTG  2280
2281  CCATATGGGT  ATTCGAGAGG  ATCTTCATCC  TCGTGGTCGA  ACAACAGGCA  GTTATTGGAT  2340
2341  GCTTATGTTC  AGACTTCAAG  TCGTAATGTT  GATTCTGGTG  AGAAGAGGTA  TTCTAGTTTG  2400
2401  CGTGCTGCAC  CATCTACTGA  TGCATGGGAT  TATCAACCAG  CTACAGTACA  TGGATATCAG  2460
2461  ATTGCATCTT  ATCTCAGTCG  AATTGCTAAG  AATAGAAGCT  CTGATTGCTT  GAATGGTCAA  2520
2521  ATGGAGTTAC  CAGCATCAAA  ATCTCCTGCC  CTCGGCCCTA  TAAATTATAG  AGACCCACTG  2580
2581  GCTTTCACAT  TAGGGCAAAA  ATTGCAAAAT  GGGATAACTC  CTGTTCAAGC  CCCTGGTTTT  2640
2641  CAGAATGTTG  CAGTTTCTAG  AAATAGTCCA  TTACAATCTG  AAAGATCATA  CTATGACATC  2700
2701  AGCTCCCTTG  GACCTAATGA  TAACTCTGTG  ATATCAGTCA  ATTCAAAGAA  GTATCATAGC  2760
2761  TTACCAGACA  TATCAGGGCT  TTCGGTTCCT  CATCGGGATT  CATACATGTC  TGACAGGAGT  2820
2821  GCTCAGTGGG  ACAGTTCCAT  TGGATATGGG  TCATCTGTTG  GTAGGACAAA  TTATGACACA  2880
2881  CCCATGTATC  CGAACACTGG  GTCAAGGGCA  GGAGTTCCAT  TGGCCTTTGA  TGAGCTTTCT  2940
2941  CAATCAAAGG  GTTATAAAGA  TGCTTTTTCC  TTCCAGTTGA  GTTCAAGTCC  AGACACTGGA  3000
3001  TCCCTTTGGT  CTAGACAGCC  TTTTGAGCAG  TTTGGTGTGG  CTGAGAAAAG  ACGAACTGCT  3060
3061  GGCAGTGAAG  CATTTGGAAG  TGGGTTGAAC  TCAGAAGCCC  GGGATACTGC  TTCTGGTGAG  3120
3121  GATTTAGAGT  CCAAGCTTCT  TCAGTCTTTC  CGAGATTGTA  TAGTAAAGCT  CTTGAAATTG  3180
3181  GATGGGTTTG  ACTGGTTGTT  TAGACAAAAT  GATGGAGCTG  ATGAGGATTT  AATTGATCGT  3240
3241  GTAGCAGCAA  GGGAGAGGTT  TGTTTATGAT  GCTGAAGCTA  GAGAGATAAA  CCAGGTTGCT  3300
3301  CACTTGGGTG  AACCTCAATA  CTTGTCTTCT  GAAAGGAGGT  ATGGTTCTAC  ACCAATAAGG  3360
3361  GACAAGGCAA  ACCTTGTCAA  CTTTTCAATT  TCATCATTTC  CTCACTGTGG  GGAGGGCTGT  3420
3421  ATTTATAAAG  CGGATTTGGT  AATAAGCTTT  GGAGTGTGGT  GCATTCACCG  GATTCTTGAT  3480
3481  CTTTCACTGA  TGGAAAGCAG  ACCAGAGCTG  TGGGGAAAAT  ACACTTACGT  GCTTAATCGT  3540
3541  CTCCAGGGTG  TCATAGACCT  GGCATTTTCT  AAGCCTCGAA  CCCCAATGAC  CCCATGCTTC  3600
3601  TGCCTTCAAA  TCCCTGTGGA  ATATCAGCAG  AGGTCAAGTC  CTCCTATTTC  AAATGGAATG  3660
3661  TTGCCCCCAG  CCGCAAAACC  TGGCCGGGGT  AAGTGTACAA  CTGCTGCAAC  GCTCTTGGAA  3720
3721  AAAATTAAGG  ATGTGGAGAT  TGCTATATCT  TGCCGGAAGG  GTCGAACAGG  CACTGCTGCT  3780
3781  GGTGATGTAG  CTTTTCCAAA  GGGAAAAGAG  AATCTGGCAT  CTGTCCTTAA  ACGCTACAAG  3840
3841  CGGCGATTGT  CCAACAAACC  ATTTGGCACC  CATGAGGGGT  CTGGGTCACG  AAAGGTTCCA  3900
3901  ACATCGACTC  CAGTGTTGGC  TTCTTACAGT  TCATAG  3936

▼ ORTHOLOGY


DrLLPS IDOrganismIdentityE-valueScore
LLPS-Gor-1708Gossypium raimondii82.00.02045
LLPS-Coc-0645Corchorus capsularis81.670.02083
LLPS-Viv-2094Vitis vinifera68.10.01665
LLPS-Pot-1171Populus trichocarpa67.850.01609
LLPS-Mae-1211Manihot esculenta65.80.01579
LLPS-Prp-1152Prunus persica64.490.01576
LLPS-Glm-0854Glycine max62.770.01563
LLPS-Cus-0874Cucumis sativus61.710.01383
LLPS-Phv-0909Phaseolus vulgaris61.40.01487
LLPS-Via-1375Vigna angularis60.290.01470
LLPS-Met-0748Medicago truncatula59.470.01419
LLPS-Vir-0896Vigna radiata59.030.01412
LLPS-Arl-2129Arabidopsis lyrata57.560.01350
LLPS-Sot-1620Solanum tuberosum57.520.01345
LLPS-Art-1201Arabidopsis thaliana57.070.01328
LLPS-Sol-2126Solanum lycopersicum56.970.01337
LLPS-Nia-2564Nicotiana attenuata56.710.01340
LLPS-Brn-2568Brassica napus56.573e-149 490
LLPS-Bro-1664Brassica oleracea55.880.01293
LLPS-Brr-1683Brassica rapa55.50.01305
LLPS-Dac-1810Daucus carota52.670.01144
LLPS-Hea-2493Helianthus annuus51.380.01116
LLPS-Orm-0098Oryza meridionalis47.845e-82 297
LLPS-Mua-1887Musa acuminata47.833e-118 406
LLPS-Amt-0265Amborella trichopoda46.890.0 964
LLPS-Sob-1154Sorghum bicolor44.550.0 869
LLPS-Sei-1234Setaria italica44.440.0 847
LLPS-Lep-2112Leersia perrieri44.410.0 844
LLPS-Orbr-0714Oryza brachyantha44.260.0 845
LLPS-Orgl-0594Oryza glumaepatula44.210.0 831
LLPS-Orp-0542Oryza punctata43.460.0 848
LLPS-Orni-2390Oryza nivara43.390.0 827
LLPS-Orb-2336Oryza barthii43.390.0 826
LLPS-Org-2027Oryza glaberrima43.390.0 826
LLPS-Ors-2325Oryza sativa43.320.0 822
LLPS-Zem-1197Zea mays43.280.0 837
LLPS-Orr-0202Oryza rufipogon43.240.0 823
LLPS-Tra-2519Triticum aestivum41.952e-101 357
LLPS-Ori-2155Oryza indica41.860.0 783
LLPS-Brd-2371Brachypodium distachyon40.270.0 735
LLPS-Tru-0300Triticum urartu37.460.0 694
LLPS-Hov-1945Hordeum vulgare36.098e-173 548
LLPS-Php-0941Physcomitrella patens34.153e-79 292
LLPS-Sem-2135Selaginella moellendorffii32.431e-162 527