• Disorder
  • Domain
  • PTM
  • Variation
  • Mutation
  • Interaction
  • Disease
  • Drug
  • Physicochemical
  • Function
  • Proteomics
  • Structure
  • Localization
  • Expression
  • Element
  • Methylation

LLPS-Thc-2170
TCM_030870

Integrated Annotations

▼ OVERVIEW


Status: Unreviewed
Protein Name: Vacuole, cultured cell-like protein
Gene Name: TCM_030870
Ensembl Gene: TCM_030870
Ensembl Protein: EOY12337
Organism: Theobroma cacao
Taxa ID: 3641
LLPS Type: Client


▼ PROPERTY



▼ Classification


Condensates:
CondensateEvidenceOrthologs
NucleolusPredicted from orthologs(View)

▼ CROSS REFERENCE


DatabaseNucleotide IDProtein ID
EnsemblEOY12337EOY12337
UniProtA0A061F6L5, A0A061F6L5_THECC
GeneBankCM001885EOY12337.1

▼ SEQUENCE


Protein Sequence (FASTA)
1     MTAEEVTVVH  VAEEEVASSS  SKVEIVVEKD  KEEEKEKEKD  DLSNGANGST  VKEEGDGDGD  60
61    GYVFVNGDEA  VHGDSVESDL  EKNGIGIGGE  DQGVENLEIK  GEVESKSDLV  KDLEGEDGSC  120
121   IGILDQDKES  TELCHVEGPV  VEDKPEDLFE  SGPVSATNVE  DGVSETSRAN  QNGVSESPEI  180
181   VSDSNGDGSA  NGVAKQTVSE  AAAVDSSGKQ  SDEVSSVSVS  DSYGGSLAND  SVVDSRSKVN  240
241   EDYETAVADD  GDSNGGSLAN  DSFKDSVVDS  RSKDDKDSET  AVPDDGDSSG  DALATDSAKD  300
301   TVSEGAVGSD  HEQNGVSELP  VSDDGVPPVS  VSDSNGDAFP  NDSAKDTVSE  AVVTDSGAEQ  360
361   NDVSKPEQND  GVPVSVSDSN  GDCLPAESVE  DTVSEVSKPE  QNESSNIVEA  EADCHGPVSN  420
421   GNGDRTEQNG  FSEMPETVHP  DNEPVKSEED  LTARDEVPVQ  GGLDLEGNSE  QGLSPKADAD  480
481   LEKDAVSGSI  SDERGEALQD  DHTQGFYSET  VVINDSVDSS  QNSQQGQSSE  IVESTPSPVT  540
541   DENVTVERGS  SDTTADSNIG  TGASADFVER  SPSTVTLENV  TVESGVVDNT  AETLPSSTVD  600
601   DEKAETEVVK  SVDDEKAETE  VIKSDENSRG  GSDSHHVEDS  EVEINVVNGS  VDDDTKLSCL  660
661   ANGLKSETKI  NSDSIVSEEA  GVSTELAEDS  IEPHNVGDKD  EKLAVADVQR  DSSLAAPLGN  720
721   DGKAPPAVEN  FSAVSNRDIT  GNDGIVHESG  VSNSDTNGSE  QNCAVINEGT  QSGSVANDGK  780
781   TCKEQEGIDE  VERKRPFYFL  IRIPRYDDED  LKEKIRLAQI  RVDEKTQSRD  AIRIEMQSKR  840
841   ATCKEYGDNF  DAARSQERAA  RDLLRSKRQE  IDSIQSVINI  DDIDGRIRNM  EHMIQHETLP  900
901   LKEEKQLVRE  INQLKQVRDQ  LSSNRGRHDE  VQQGSDQKEE  IEKRLKSLKK  EVDQLKDNLL  960
961   KAEAVTKVAK  KKYYDETEKL  NKLLSQFKAA  DDIRQEAYAQ  LQGLKKQSYE  KSKYFWQYRD  1020
1021  DAKTANDLAL  KGDKEALQNL  CVNQVERVMD  LWNNNDEFRK  EYMRCNVRST  LRRLRTMDGR  1080
1081  ALGPDEEPPV  IPQVVNGRVA  KDHTVSSSTL  EERIQEKPVL  AKAEKTNDKP  VTKAVEQKNQ  1140
1141  TSKSEKSVKS  VHPVSGSTTA  SSRDEIEEAR  DEKPKRAKEE  EELARKEEEL  ARKAEDLRKE  1200
1201  EEAAKLREQR  RLEEIAKAKE  ALERKRRIAE  KAQARAALRA  QKEAEQKEKE  REKRARKKEK  1260
1261  RKVATAAAGD  ANATDEVEPA  PASETPTETQ  KESENKEKPV  IVAKRPQKPS  QFTKQSKAKS  1320
1321  IPPPLRNRGK  RRMQPWMWVL  LTTLVIFALL  LVGNGNFFSN  FGLQRFYF  1368
Nucleotide CDS Sequence (FASTA)
1     ATGACGGCGG  AGGAGGTGAC  GGTGGTGCAT  GTGGCGGAGG  AGGAGGTGGC  ATCGTCTTCA  60
61    TCCAAGGTTG  AGATTGTGGT  GGAGAAAGAT  AAGGAGGAAG  AGAAGGAGAA  GGAAAAGGAC  120
121   GATCTTTCCA  ATGGCGCCAA  TGGGAGTACT  GTTAAGGAAG  AAGGTGACGG  TGACGGTGAC  180
181   GGTTACGTTT  TCGTTAACGG  AGACGAAGCA  GTGCATGGCG  ACTCAGTGGA  GTCGGATCTT  240
241   GAGAAAAACG  GCATTGGCAT  TGGTGGCGAA  GATCAGGGAG  TTGAGAATTT  GGAGATTAAA  300
301   GGAGAAGTGG  AATCTAAATC  TGATTTGGTT  AAGGATTTGG  AAGGAGAGGA  TGGATCTTGT  360
361   ATTGGAATTC  TGGATCAGGA  CAAGGAATCA  ACGGAATTGT  GCCACGTGGA  GGGTCCTGTT  420
421   GTCGAAGACA  AACCGGAGGA  TCTTTTTGAG  AGTGGTCCTG  TTTCTGCTAC  TAATGTAGAA  480
481   GATGGTGTTT  CGGAAACTTC  CAGGGCTAAT  CAGAATGGAG  TCTCTGAATC  GCCTGAAATT  540
541   GTTTCTGATA  GTAATGGAGA  TGGTTCAGCT  AATGGTGTTG  CTAAACAAAC  TGTTTCAGAA  600
601   GCTGCTGCTG  TTGATTCCAG  TGGTAAACAG  AGTGATGAGG  TTTCTTCTGT  CTCTGTCTCT  660
661   GATAGTTATG  GAGGTAGTTT  GGCTAATGAC  AGTGTTGTCG  ATTCCAGGTC  AAAAGTAAAT  720
721   GAGGACTATG  AAACGGCTGT  AGCTGATGAT  GGTGATAGTA  ATGGAGGTAG  TTTGGCTAAT  780
781   GATAGTTTCA  AAGACAGTGT  TGTCGATTCC  AGGTCAAAAG  ATGATAAGGA  CTCTGAAACG  840
841   GCTGTACCTG  ATGATGGTGA  TAGCAGTGGA  GATGCTTTAG  CTACTGATAG  CGCCAAGGAC  900
901   ACTGTTTCTG  AAGGTGCTGT  TGGTTCCGAT  CATGAACAGA  ATGGGGTTTC  TGAATTGCCT  960
961   GTATCTGATG  ATGGGGTTCC  TCCTGTCTCT  GTCTCTGACA  GTAATGGGGA  TGCTTTTCCT  1020
1021  AATGATAGTG  CCAAAGACAC  TGTTTCAGAA  GCTGTTGTTA  CTGATTCCGG  GGCTGAACAG  1080
1081  AATGATGTTT  CCAAGCCTGA  ACAGAATGAT  GGTGTTCCTG  TCTCTGTCTC  TGATTCTAAC  1140
1141  GGGGATTGTT  TACCTGCTGA  AAGTGTGGAG  GATACTGTTT  CAGAAGTTTC  CAAGCCTGAA  1200
1201  CAGAATGAGT  CCTCTAACAT  AGTTGAGGCT  GAAGCTGATT  GTCATGGTCC  TGTCTCTAAT  1260
1261  GGTAATGGAG  ACAGGACTGA  ACAAAATGGG  TTCTCTGAAA  TGCCTGAAAC  CGTGCACCCA  1320
1321  GACAATGAAC  CGGTTAAAAG  TGAGGAAGAT  TTAACAGCTA  GGGATGAGGT  TCCTGTGCAA  1380
1381  GGTGGGTTGG  ACTTGGAAGG  TAATTCTGAA  CAAGGTTTGT  CTCCAAAGGC  TGATGCTGAT  1440
1441  TTAGAAAAAG  ATGCTGTTAG  CGGTTCCATT  TCTGATGAAC  GTGGAGAGGC  CTTGCAGGAT  1500
1501  GATCACACTC  AGGGTTTCTA  TTCAGAGACA  GTTGTGATTA  ACGACTCAGT  TGATTCAAGT  1560
1561  CAAAACTCAC  AACAAGGTCA  GTCTTCTGAA  ATCGTAGAAA  GCACACCCTC  CCCTGTTACA  1620
1621  GATGAGAATG  TAACTGTTGA  AAGGGGTTCT  AGTGATACAA  CAGCTGATTC  AAATATTGGC  1680
1681  ACTGGGGCTT  CTGCTGATTT  TGTGGAAAGA  TCTCCCTCCA  CAGTTACACT  CGAAAATGTA  1740
1741  ACAGTTGAAA  GTGGTGTTGT  TGATAATACG  GCTGAAACAT  TACCATCTTC  TACTGTTGAT  1800
1801  GATGAGAAAG  CTGAAACTGA  AGTCGTAAAG  TCTGTTGATG  ATGAGAAGGC  AGAAACTGAA  1860
1861  GTCATAAAGT  CAGATGAGAA  TAGCAGAGGG  GGTTCAGATT  CCCATCATGT  TGAGGATTCA  1920
1921  GAGGTAGAAA  TTAATGTTGT  GAATGGTTCT  GTTGATGATG  ATACTAAGTT  AAGTTGCCTA  1980
1981  GCCAATGGTT  TGAAATCAGA  AACAAAGATC  AATTCTGATT  CTATTGTCTC  TGAAGAGGCT  2040
2041  GGGGTTTCAA  CAGAGCTTGC  TGAAGATAGC  ATTGAGCCCC  ACAATGTTGG  TGATAAAGAT  2100
2101  GAAAAATTGG  CTGTGGCTGA  TGTTCAAAGG  GATAGTAGTC  TGGCTGCTCC  TCTAGGTAAT  2160
2161  GATGGGAAAG  CACCTCCTGC  AGTTGAAAAT  TTCTCTGCTG  TGAGTAACAG  GGATATTACT  2220
2221  GGCAATGATG  GCATTGTACA  TGAATCTGGA  GTATCGAATA  GTGATACTAA  TGGTAGTGAA  2280
2281  CAAAATTGTG  CTGTCATAAA  TGAAGGAACT  CAATCTGGTA  GTGTTGCTAA  TGATGGTAAA  2340
2341  ACATGCAAAG  AACAAGAGGG  CATTGATGAG  GTTGAAAGAA  AAAGGCCATT  TTACTTCTTG  2400
2401  ATCAGGATCC  CAAGATATGA  TGACGAAGAT  TTAAAAGAAA  AAATCAGACT  TGCTCAGATT  2460
2461  AGAGTTGATG  AAAAAACTCA  AAGTCGGGAT  GCAATTCGAA  TTGAAATGCA  AAGCAAGAGG  2520
2521  GCCACTTGCA  AGGAATATGG  TGATAATTTT  GATGCTGCCA  GATCCCAAGA  GAGAGCAGCA  2580
2581  AGAGACTTGC  TTAGGTCCAA  ACGCCAGGAA  ATAGATTCTA  TTCAGTCTGT  GATTAACATT  2640
2641  GATGATATTG  ATGGCAGGAT  ACGAAACATG  GAACACATGA  TACAACATGA  AACGCTGCCT  2700
2701  CTTAAGGAAG  AAAAGCAGTT  AGTTCGTGAA  ATCAACCAAT  TAAAGCAAGT  TCGTGACCAG  2760
2761  CTCTCTTCTA  ATAGGGGTAG  GCATGATGAA  GTTCAGCAGG  GTTCGGACCA  GAAAGAAGAA  2820
2821  ATTGAAAAGC  GCCTGAAGTC  TTTAAAGAAG  GAAGTAGACC  AATTAAAAGA  CAATCTCCTG  2880
2881  AAGGCTGAGG  CAGTCACTAA  GGTTGCTAAG  AAAAAATATT  ATGATGAAAC  TGAAAAGTTA  2940
2941  AACAAGTTGC  TGTCCCAGTT  CAAAGCTGCA  GATGACATTC  GCCAAGAAGC  ATATGCACAG  3000
3001  TTGCAGGGTT  TGAAGAAACA  ATCATATGAG  AAGAGCAAAT  ATTTTTGGCA  GTACAGGGAT  3060
3061  GATGCAAAGA  CAGCGAATGA  TTTGGCTTTG  AAAGGGGATA  AAGAGGCACT  TCAAAATCTG  3120
3121  TGTGTTAACC  AGGTGGAGAG  AGTTATGGAC  TTATGGAACA  ACAATGATGA  ATTCCGTAAA  3180
3181  GAATATATGA  GATGCAATGT  CAGGAGCACG  CTAAGAAGAC  TGAGGACAAT  GGATGGCCGT  3240
3241  GCACTTGGTC  CTGATGAAGA  GCCACCTGTA  ATTCCTCAAG  TAGTGAATGG  AAGAGTGGCT  3300
3301  AAGGATCATA  CTGTGTCCAG  CTCAACTTTG  GAAGAACGAA  TACAAGAGAA  ACCAGTGCTT  3360
3361  GCAAAAGCTG  AAAAGACAAA  TGATAAACCT  GTGACAAAGG  CTGTGGAGCA  AAAGAATCAG  3420
3421  ACAAGTAAAT  CAGAGAAGTC  TGTGAAATCT  GTTCATCCAG  TAAGTGGCTC  AACAACTGCC  3480
3481  TCTTCCAGGG  ATGAAATTGA  AGAGGCAAGA  GACGAAAAAC  CAAAGAGAGC  AAAGGAGGAA  3540
3541  GAGGAATTGG  CTAGGAAGGA  AGAGGAATTG  GCTAGGAAGG  CAGAGGACTT  GAGAAAGGAA  3600
3601  GAGGAAGCAG  CTAAACTGAG  GGAGCAACGT  CGGTTGGAGG  AGATAGCTAA  AGCTAAGGAG  3660
3661  GCACTGGAGA  GGAAGAGGCG  AATTGCAGAG  AAGGCCCAAG  CCAGGGCTGC  CCTAAGAGCT  3720
3721  CAAAAAGAAG  CTGAACAGAA  AGAGAAGGAA  AGAGAAAAGA  GGGCAAGGAA  GAAGGAAAAA  3780
3781  AGAAAGGTGG  CTACAGCTGC  AGCAGGGGAT  GCAAATGCCA  CAGATGAAGT  CGAACCTGCT  3840
3841  CCAGCTTCTG  AAACTCCCAC  TGAAACTCAA  AAAGAATCTG  AAAACAAAGA  GAAACCGGTG  3900
3901  ATTGTGGCAA  AAAGGCCTCA  AAAGCCATCG  CAGTTCACAA  AGCAGAGCAA  GGCAAAATCT  3960
3961  ATTCCCCCTC  CTCTCCGCAA  CCGGGGCAAG  AGAAGGATGC  AGCCATGGAT  GTGGGTCCTT  4020
4021  CTCACCACCT  TGGTTATCTT  CGCCTTGTTG  TTGGTCGGAA  ACGGTAACTT  CTTTTCCAAC  4080
4081  TTTGGGCTGC  AAAGGTTTTA  CTTCTAG  4107

▼ ORTHOLOGY


DrLLPS IDOrganismIdentityE-valueScore
LLPS-Cus-1859Cucumis sativus75.08e-20 100
LLPS-Gor-1567Gossypium raimondii69.151e-26 123
LLPS-Met-1777Medicago truncatula64.414e-1689.0
LLPS-Pot-1085Populus trichocarpa61.963e-20 102
LLPS-Mae-0985Manihot esculenta60.987e-1894.4
LLPS-Glm-2514Glycine max58.061e-1277.4
LLPS-Vir-2246Vigna radiata54.842e-1792.8
LLPS-Phv-1132Phaseolus vulgaris54.841e-1690.5
LLPS-Brr-1850Brassica rapa54.54e-107 377
LLPS-Brn-2460Brassica napus54.117e-105 369
LLPS-Bro-0335Brassica oleracea54.116e-105 370
LLPS-Via-2426Vigna angularis53.572e-1999.8
LLPS-Viv-1476Vitis vinifera51.918e-159 524
LLPS-Nia-0482Nicotiana attenuata51.614e-1688.6
LLPS-Hea-2478Helianthus annuus51.411e-85 313
LLPS-Arl-1591Arabidopsis lyrata50.664e-97 344
LLPS-Art-0756Arabidopsis thaliana50.261e-96 345
LLPS-Sol-1155Solanum lycopersicum49.66e-96 344
LLPS-Prp-0127Prunus persica49.231e-163 531
LLPS-Coc-1354Corchorus capsularis49.13e-30 134
LLPS-Lep-1452Leersia perrieri43.526e-58 225
LLPS-Sei-2400Setaria italica43.525e-69 260
LLPS-Orp-1041Oryza punctata43.232e-63 242
LLPS-Orm-1601Oryza meridionalis42.92e-62 239
LLPS-Orb-1488Oryza barthii42.581e-61 236
LLPS-Orni-2086Oryza nivara42.581e-61 236
LLPS-Orgl-1986Oryza glumaepatula42.583e-62 238
LLPS-Orr-1582Oryza rufipogon42.582e-61 236
LLPS-Mua-0624Musa acuminata42.251e-64 246
LLPS-Orbr-1827Oryza brachyantha41.839e-58 223
LLPS-Zem-2166Zea mays41.533e-63 241
LLPS-Sob-2207Sorghum bicolor41.069e-63 240
LLPS-Tru-1762Triticum urartu39.074e-56 218
LLPS-Tra-2855Triticum aestivum39.031e-58 226
LLPS-Amt-0033Amborella trichopoda38.655e-60 231
LLPS-Brd-1256Brachypodium distachyon37.431e-57 223
LLPS-Sem-2126Selaginella moellendorffii34.491e-34 146
LLPS-Ori-1349Oryza indica33.758e-35 146
LLPS-Php-0400Physcomitrella patens32.71e-37 155
LLPS-Dac-1228Daucus carota27.017e-24 112
LLPS-Ors-1750Oryza sativa24.698e-1067.8
LLPS-Org-0155Oryza glaberrima24.214e-1068.6
LLPS-Hov-1845Hordeum vulgare23.512e-0656.2