• Disorder
  • Domain
  • PTM
  • Variation
  • Mutation
  • Interaction
  • Disease
  • Drug
  • Physicochemical
  • Function
  • Proteomics
  • Structure
  • Localization
  • Expression
  • Element
  • Methylation

LLPS-Thc-2139
TCM_030609

Integrated Annotations

▼ OVERVIEW


Status: Unreviewed
Protein Name: Sequence-specific DNA binding,sequence-specific DNA binding transcription factors, putative isoform 1
Gene Name: TCM_030609
Ensembl Gene: TCM_030609
Ensembl Protein: EOY11983
Organism: Theobroma cacao
Taxa ID: 3641
LLPS Type: Client


▼ PROPERTY



——— Disorder propensity (calculated by IUPred2A)

▼ Classification


Condensates:
CondensateEvidenceOrthologs
NucleolusPredicted from orthologs(View)

▼ CROSS REFERENCE


DatabaseNucleotide IDProtein ID
EnsemblEOY11983EOY11983
EnsemblEOY11981EOY11981
EnsemblEOY11982EOY11982
UniProtA0A061F4L8, A0A061F4L8_THECC
GeneBankCM001885EOY11981.1

▼ SEQUENCE


Protein Sequence (FASTA)
1     MGSDRSLFIP  PHVAKLLYLV  SFGQVHPWLL  IQVTHLPSRT  TLRSSNPFLS  RSLYPQKRTL  60
61    GQVGKEKSSC  SHGGYWVISI  LTLQNIPRVF  SYSIPIWVFI  RLFTSRFLNM  RQGKEEAVCS  120
121   VEQAIDLISV  VKEIHGLSAK  EINKLLRDSE  NFTIHFVTEK  GSEVKIDVEK  LAGCLPLHLI  180
181   AVLMSSDRDE  ALLRYLLCGI  RLLHSLCELA  PRHTKLEQSL  LDDVKVSEQL  IDLVFYVLVV  240
241   LNDYRQDIHK  SSPVPLLHSA  LVACSLYLLT  GCISSQWQDL  ALVIVAHPKV  DMFMDVACRA  300
301   VHLVVRFLQN  KLSAEHTDIC  AKLSPTAEFI  VNYLCQQCEA  SLQFLQLLCQ  QKPFRERLLR  360
361   NKELCGKGGI  LFLAQSILKL  HAPYFVESST  VMAALSRMKA  KVLSILLNLC  EAESISYLDE  420
421   VASSPGSLDL  AKSVALEVLE  LLKTGLSKDP  KQLTASSDRT  YPMGLLQLNA  MRLADIFSDD  480
481   SNFRSYITVH  FTDFLSAIFS  LSHGDFLSMW  CSADLPVREE  DGTLYYEIFP  AVGWALESLS  540
541   SSDLTNTRDL  YFNFIYNNMS  QASYVHQRTS  LFVKVIANLH  CFVPNICEEQ  ERNLFLHKFL  600
601   GCLRNDPSKL  LPSFIFVSGP  QKAAAIYRNL  RSLLSHAESL  IPTFLNEDDL  QLLRVFFDQL  660
661   QSLINPAEFE  ENRVQEDRSL  GGCSSPLLRT  EPPNRNNRNG  NLKEEMSENS  AFQEEEQCYV  720
721   RSNHMDQADD  ITRQDMMDDK  DKSVTPIGLK  EIDRDVQNVE  TSGSDTSSTK  GKNAVDKLVE  780
781   RLRDSTPAGV  REDEKVETVQ  TEEKQRRKRK  RTIMNDEQVT  IIERALLDEP  EMQRNTASIQ  840
841   SWADKLCHHG  SEVTCSQLRN  WLNNRKARLA  RASKDARPPP  EPDNAFAGKQ  GGPQPGHPFK  900
901   APDSSGEEAA  PSNTRGTRSM  SRISTSENPE  APEFVDFGAA  EFVQCKPGQF  VVLVDGRGEE  960
961   IGKGKVHQVQ  GKWCGKSLEE  SGTCVVDAVD  LKADKWVKLP  YPSEATGTSF  EEAETKFGVM  1020
1021  RVMWDSNKIF  LLRPQ  1035
Nucleotide CDS Sequence (FASTA)
1     ATGAGGCAAG  GCAAGGAAGA  AGCAGTATGC  AGTGTTGAAC  AGGCCATTGA  CTTGATTTCA  60
61    GTGGTGAAGG  AGATTCATGG  GCTTAGTGCA  AAGGAGATTA  ATAAGTTGCT  GAGAGACTCC  120
121   GAAAATTTTA  CCATTCACTT  TGTTACTGAA  AAAGGATCAG  AAGTAAAGAT  TGATGTGGAA  180
181   AAACTTGCAG  GATGTCTTCC  TTTGCACCTT  ATTGCAGTGC  TCATGTCATC  TGATAGAGAT  240
241   GAAGCGCTGC  TCCGATATTT  ACTATGTGGC  ATCCGGCTTT  TACATTCCTT  GTGCGAATTA  300
301   GCCCCTCGCC  ACACTAAACT  TGAGCAGAGT  TTGCTTGATG  ATGTAAAAGT  ATCAGAACAG  360
361   CTGATTGATC  TGGTCTTTTA  TGTGCTGGTT  GTTCTCAATG  ATTACAGACA  GGACATCCAT  420
421   AAATCAAGTC  CTGTGCCTCT  TTTACATTCA  GCACTTGTGG  CATGCAGTCT  GTATCTATTG  480
481   ACTGGATGTA  TATCTTCACA  GTGGCAAGAT  CTGGCACTAG  TGATAGTGGC  ACATCCTAAG  540
541   GTTGACATGT  TTATGGATGT  AGCTTGCAGA  GCTGTTCATC  TAGTTGTCAG  GTTTCTCCAA  600
601   AACAAGCTGT  CTGCTGAGCA  TACTGATATC  TGTGCAAAGT  TGAGTCCAAC  TGCTGAATTC  660
661   ATAGTTAACT  ATCTTTGCCA  ACAATGTGAG  GCTTCTTTAC  AGTTCCTTCA  GTTATTGTGC  720
721   CAACAGAAAC  CATTTCGGGA  GCGCTTACTG  AGGAATAAGG  AACTATGCGG  AAAGGGTGGT  780
781   ATTCTTTTTC  TGGCTCAATC  CATCCTGAAG  TTGCATGCAC  CTTATTTTGT  AGAATCTTCC  840
841   ACGGTCATGG  CTGCATTATC  TAGGATGAAA  GCTAAAGTTC  TGTCAATTTT  ATTGAATTTG  900
901   TGTGAAGCAG  AAAGCATTTC  TTATCTTGAT  GAGGTTGCCA  GCTCTCCAGG  AAGCCTGGAT  960
961   TTGGCAAAGT  CTGTTGCACT  TGAGGTCCTT  GAGTTGTTGA  AGACTGGACT  CAGTAAAGAT  1020
1021  CCCAAGCAGC  TCACTGCTAG  TTCTGATAGA  ACCTATCCTA  TGGGGCTTCT  GCAACTTAAT  1080
1081  GCAATGCGTC  TAGCTGATAT  CTTCTCTGAT  GATTCAAACT  TTCGATCTTA  CATCACTGTG  1140
1141  CACTTTACTG  ACTTTTTGAG  TGCAATATTT  TCACTCTCTC  ATGGAGATTT  TCTATCCATG  1200
1201  TGGTGTTCGG  CTGATCTCCC  TGTAAGGGAA  GAAGATGGTA  CCCTGTATTA  TGAAATATTT  1260
1261  CCTGCAGTTG  GATGGGCTTT  AGAGTCACTT  TCATCATCAG  ACCTAACAAA  TACAAGAGAT  1320
1321  CTGTATTTCA  ATTTTATTTA  TAACAACATG  TCTCAAGCAT  CCTATGTACA  TCAAAGAACA  1380
1381  TCTTTATTTG  TCAAAGTAAT  TGCAAACCTC  CATTGTTTTG  TTCCAAACAT  CTGTGAAGAG  1440
1441  CAGGAGAGGA  ACCTCTTCCT  TCACAAATTT  CTTGGATGCT  TGCGAAACGA  TCCATCTAAG  1500
1501  CTATTACCCA  GTTTTATCTT  TGTCTCTGGT  CCACAAAAGG  CTGCTGCTAT  TTACAGGAAC  1560
1561  CTGCGTTCCC  TGTTAAGTCA  TGCGGAATCT  TTAATTCCCA  CTTTTCTGAA  TGAGGATGAC  1620
1621  TTGCAGCTCT  TAAGGGTATT  CTTTGACCAA  TTACAATCAC  TGATAAACCC  TGCTGAATTT  1680
1681  GAAGAAAACC  GAGTTCAGGA  GGATCGAAGT  CTAGGGGGGT  GCTCATCTCC  TTTACTGAGA  1740
1741  ACGGAACCTC  CAAATCGTAA  TAACCGAAAT  GGTAACCTGA  AAGAGGAAAT  GTCTGAGAAT  1800
1801  TCTGCTTTTC  AAGAGGAAGA  GCAGTGTTAT  GTCAGAAGCA  ATCATATGGA  TCAAGCTGAT  1860
1861  GATATAACAA  GGCAAGACAT  GATGGATGAT  AAAGACAAAT  CTGTAACACC  TATTGGTTTG  1920
1921  AAAGAAATTG  ACAGAGATGT  TCAGAATGTT  GAAACAAGTG  GTTCAGATAC  AAGTTCCACA  1980
1981  AAGGGAAAAA  ATGCCGTTGA  TAAATTAGTT  GAGCGTCTCA  GAGATAGTAC  ACCTGCAGGA  2040
2041  GTTCGAGAGG  ATGAAAAAGT  TGAAACTGTT  CAAACTGAAG  AGAAGCAACG  GAGAAAAAGG  2100
2101  AAGCGAACTA  TAATGAATGA  TGAACAGGTG  ACAATAATAG  AAAGGGCCCT  TTTGGATGAA  2160
2161  CCTGAAATGC  AGCGAAATAC  TGCTTCTATA  CAATCGTGGG  CTGATAAATT  ATGTCATCAT  2220
2221  GGCTCAGAGG  TTACATGTTC  GCAGCTACGG  AACTGGCTCA  ACAATCGAAA  GGCCAGGCTT  2280
2281  GCACGAGCAA  GTAAGGATGC  TCGCCCCCCT  CCAGAGCCTG  ATAATGCTTT  TGCAGGAAAG  2340
2341  CAAGGTGGGC  CACAACCAGG  TCATCCATTC  AAAGCACCTG  ATAGTTCTGG  TGAAGAGGCT  2400
2401  GCCCCCTCAA  ATACCAGAGG  CACTCGAAGC  ATGTCAAGAA  TTAGCACCAG  TGAAAACCCA  2460
2461  GAGGCTCCAG  AATTTGTTGA  TTTTGGTGCT  GCAGAATTTG  TTCAGTGCAA  GCCAGGTCAG  2520
2521  TTTGTAGTGC  TTGTAGATGG  ACGAGGTGAG  GAGATTGGTA  AGGGAAAAGT  ACACCAGGTT  2580
2581  CAAGGTAAAT  GGTGTGGAAA  GAGCTTGGAG  GAATCAGGGA  CGTGTGTTGT  GGATGCCGTT  2640
2641  GACCTAAAGG  CTGACAAATG  GGTGAAGCTA  CCCTACCCAT  CTGAAGCCAC  AGGTACCTCA  2700
2701  TTTGAAGAGG  CTGAAACAAA  ATTTGGGGTA  ATGAGAGTGA  TGTGGGATTC  AAACAAAATA  2760
2761  TTCTTGTTGC  GACCTCAATA  A  2781

▼ ORTHOLOGY


DrLLPS IDOrganismIdentityE-valueScore
LLPS-Coc-1031Corchorus capsularis86.760.01495
LLPS-Gor-2016Gossypium raimondii86.520.01554
LLPS-Vir-1530Vigna radiata67.021e-155 474
LLPS-Mae-2059Manihot esculenta66.940.01191
LLPS-Viv-2275Vitis vinifera63.720.01107
LLPS-Pot-2430Populus trichocarpa63.010.0 960
LLPS-Prp-1922Prunus persica62.950.01082
LLPS-Cus-0153Cucumis sativus61.00.01022
LLPS-Glm-2203Glycine max59.00.01000
LLPS-Phv-1866Phaseolus vulgaris58.630.0 980
LLPS-Via-1510Vigna angularis57.590.0 927
LLPS-Sol-2212Solanum lycopersicum55.150.0 878
LLPS-Nia-1895Nicotiana attenuata53.630.0 867
LLPS-Met-2259Medicago truncatula52.60.0 870
LLPS-Amt-0552Amborella trichopoda51.052e-171 538
LLPS-Ori-2272Oryza indica50.852e-111 372
LLPS-Orbr-1784Oryza brachyantha49.361e-136 443
LLPS-Org-1847Oryza glaberrima48.79e-135 437
LLPS-Dac-0024Daucus carota48.320.0 721
LLPS-Arl-0038Arabidopsis lyrata48.260.0 680
LLPS-Brd-2206Brachypodium distachyon48.246e-133 432
LLPS-Sei-1944Setaria italica48.071e-133 434
LLPS-Art-0295Arabidopsis thaliana47.910.0 687
LLPS-Sob-0889Sorghum bicolor47.85e-128 421
LLPS-Tra-0878Triticum aestivum46.881e-135 439
LLPS-Orb-0064Oryza barthii46.82e-89 311
LLPS-Hov-0911Hordeum vulgare46.591e-133 434
LLPS-Zem-1556Zea mays46.454e-123 405
LLPS-Orr-1248Oryza rufipogon46.212e-121 401
LLPS-Orp-2038Oryza punctata45.574e-115 383
LLPS-Orni-1545Oryza nivara45.572e-115 384
LLPS-Orgl-0542Oryza glumaepatula45.392e-114 382
LLPS-Brr-0973Brassica rapa44.990.0 669
LLPS-Lep-1481Leersia perrieri44.927e-120 396
LLPS-Brn-1202Brassica napus44.660.0 663
LLPS-Bro-2525Brassica oleracea44.340.0 662
LLPS-Hea-0009Helianthus annuus44.330.0 626
LLPS-Tru-0734Triticum urartu44.31e-45 182
LLPS-Orm-1848Oryza meridionalis44.127e-79 281
LLPS-Ors-2299Oryza sativa43.64e-26 118
LLPS-Mua-1243Musa acuminata38.669e-133 429
LLPS-Php-1533Physcomitrella patens38.334e-98 340
LLPS-Sem-1110Selaginella moellendorffii37.068e-80 286