DrLLPS - Data resource of LLPS


Status:	Unreviewed
Protein Name:	Sequence-specific DNA binding,sequence-specific DNA binding transcription factors, putative isoform 1
Gene Name:	TCM_030609
Ensembl Gene:	TCM_030609
Ensembl Protein:	EOY11983
Organism:	Theobroma cacao
Taxa ID:	3641
LLPS Type:	Client

Condensate	Evidence	Orthologs
Nucleolus	Predicted from orthologs	(View)

Condensate

Evidence

Orthologs

Nucleolus

Predicted from orthologs

(View)

Organism	DrLLPS ID	UniProt ID	LLPS type	Condensate	Identity	E-value	Score
Arabidopsis thaliana	LLPS-Art-0295	F4JI44	Client	Nucleolus	47.49	0.0	717

Database	Nucleotide ID	Protein ID
Ensembl	EOY11983	EOY11983
Ensembl	EOY11981	EOY11981
Ensembl	EOY11982	EOY11982
UniProt		A0A061F4L8, A0A061F4L8_THECC
GeneBank	CM001885	EOY11981.1

Database

Nucleotide ID

Protein ID

Ensembl

EOY11983

Ensembl

EOY11981

Ensembl

EOY11982

UniProt

A0A061F4L8, A0A061F4L8_THECC

GeneBank

CM001885

EOY11981.1

Protein Sequence (FASTA)
1 MGSDRSLFIP PHVAKLLYLV SFGQVHPWLL IQVTHLPSRT TLRSSNPFLS RSLYPQKRTL 60 61 GQVGKEKSSC SHGGYWVISI LTLQNIPRVF SYSIPIWVFI RLFTSRFLNM RQGKEEAVCS 120 121 VEQAIDLISV VKEIHGLSAK EINKLLRDSE NFTIHFVTEK GSEVKIDVEK LAGCLPLHLI 180 181 AVLMSSDRDE ALLRYLLCGI RLLHSLCELA PRHTKLEQSL LDDVKVSEQL IDLVFYVLVV 240 241 LNDYRQDIHK SSPVPLLHSA LVACSLYLLT GCISSQWQDL ALVIVAHPKV DMFMDVACRA 300 301 VHLVVRFLQN KLSAEHTDIC AKLSPTAEFI VNYLCQQCEA SLQFLQLLCQ QKPFRERLLR 360 361 NKELCGKGGI LFLAQSILKL HAPYFVESST VMAALSRMKA KVLSILLNLC EAESISYLDE 420 421 VASSPGSLDL AKSVALEVLE LLKTGLSKDP KQLTASSDRT YPMGLLQLNA MRLADIFSDD 480 481 SNFRSYITVH FTDFLSAIFS LSHGDFLSMW CSADLPVREE DGTLYYEIFP AVGWALESLS 540 541 SSDLTNTRDL YFNFIYNNMS QASYVHQRTS LFVKVIANLH CFVPNICEEQ ERNLFLHKFL 600 601 GCLRNDPSKL LPSFIFVSGP QKAAAIYRNL RSLLSHAESL IPTFLNEDDL QLLRVFFDQL 660 661 QSLINPAEFE ENRVQEDRSL GGCSSPLLRT EPPNRNNRNG NLKEEMSENS AFQEEEQCYV 720 721 RSNHMDQADD ITRQDMMDDK DKSVTPIGLK EIDRDVQNVE TSGSDTSSTK GKNAVDKLVE 780 781 RLRDSTPAGV REDEKVETVQ TEEKQRRKRK RTIMNDEQVT IIERALLDEP EMQRNTASIQ 840 841 SWADKLCHHG SEVTCSQLRN WLNNRKARLA RASKDARPPP EPDNAFAGKQ GGPQPGHPFK 900 901 APDSSGEEAA PSNTRGTRSM SRISTSENPE APEFVDFGAA EFVQCKPGQF VVLVDGRGEE 960 961 IGKGKVHQVQ GKWCGKSLEE SGTCVVDAVD LKADKWVKLP YPSEATGTSF EEAETKFGVM 1020 1021 RVMWDSNKIF LLRPQ 1035
Nucleotide CDS Sequence (FASTA)
1 ATGAGGCAAG GCAAGGAAGA AGCAGTATGC AGTGTTGAAC AGGCCATTGA CTTGATTTCA 60 61 GTGGTGAAGG AGATTCATGG GCTTAGTGCA AAGGAGATTA ATAAGTTGCT GAGAGACTCC 120 121 GAAAATTTTA CCATTCACTT TGTTACTGAA AAAGGATCAG AAGTAAAGAT TGATGTGGAA 180 181 AAACTTGCAG GATGTCTTCC TTTGCACCTT ATTGCAGTGC TCATGTCATC TGATAGAGAT 240 241 GAAGCGCTGC TCCGATATTT ACTATGTGGC ATCCGGCTTT TACATTCCTT GTGCGAATTA 300 301 GCCCCTCGCC ACACTAAACT TGAGCAGAGT TTGCTTGATG ATGTAAAAGT ATCAGAACAG 360 361 CTGATTGATC TGGTCTTTTA TGTGCTGGTT GTTCTCAATG ATTACAGACA GGACATCCAT 420 421 AAATCAAGTC CTGTGCCTCT TTTACATTCA GCACTTGTGG CATGCAGTCT GTATCTATTG 480 481 ACTGGATGTA TATCTTCACA GTGGCAAGAT CTGGCACTAG TGATAGTGGC ACATCCTAAG 540 541 GTTGACATGT TTATGGATGT AGCTTGCAGA GCTGTTCATC TAGTTGTCAG GTTTCTCCAA 600 601 AACAAGCTGT CTGCTGAGCA TACTGATATC TGTGCAAAGT TGAGTCCAAC TGCTGAATTC 660 661 ATAGTTAACT ATCTTTGCCA ACAATGTGAG GCTTCTTTAC AGTTCCTTCA GTTATTGTGC 720 721 CAACAGAAAC CATTTCGGGA GCGCTTACTG AGGAATAAGG AACTATGCGG AAAGGGTGGT 780 781 ATTCTTTTTC TGGCTCAATC CATCCTGAAG TTGCATGCAC CTTATTTTGT AGAATCTTCC 840 841 ACGGTCATGG CTGCATTATC TAGGATGAAA GCTAAAGTTC TGTCAATTTT ATTGAATTTG 900 901 TGTGAAGCAG AAAGCATTTC TTATCTTGAT GAGGTTGCCA GCTCTCCAGG AAGCCTGGAT 960 961 TTGGCAAAGT CTGTTGCACT TGAGGTCCTT GAGTTGTTGA AGACTGGACT CAGTAAAGAT 1020 1021 CCCAAGCAGC TCACTGCTAG TTCTGATAGA ACCTATCCTA TGGGGCTTCT GCAACTTAAT 1080 1081 GCAATGCGTC TAGCTGATAT CTTCTCTGAT GATTCAAACT TTCGATCTTA CATCACTGTG 1140 1141 CACTTTACTG ACTTTTTGAG TGCAATATTT TCACTCTCTC ATGGAGATTT TCTATCCATG 1200 1201 TGGTGTTCGG CTGATCTCCC TGTAAGGGAA GAAGATGGTA CCCTGTATTA TGAAATATTT 1260 1261 CCTGCAGTTG GATGGGCTTT AGAGTCACTT TCATCATCAG ACCTAACAAA TACAAGAGAT 1320 1321 CTGTATTTCA ATTTTATTTA TAACAACATG TCTCAAGCAT CCTATGTACA TCAAAGAACA 1380 1381 TCTTTATTTG TCAAAGTAAT TGCAAACCTC CATTGTTTTG TTCCAAACAT CTGTGAAGAG 1440 1441 CAGGAGAGGA ACCTCTTCCT TCACAAATTT CTTGGATGCT TGCGAAACGA TCCATCTAAG 1500 1501 CTATTACCCA GTTTTATCTT TGTCTCTGGT CCACAAAAGG CTGCTGCTAT TTACAGGAAC 1560 1561 CTGCGTTCCC TGTTAAGTCA TGCGGAATCT TTAATTCCCA CTTTTCTGAA TGAGGATGAC 1620 1621 TTGCAGCTCT TAAGGGTATT CTTTGACCAA TTACAATCAC TGATAAACCC TGCTGAATTT 1680 1681 GAAGAAAACC GAGTTCAGGA GGATCGAAGT CTAGGGGGGT GCTCATCTCC TTTACTGAGA 1740 1741 ACGGAACCTC CAAATCGTAA TAACCGAAAT GGTAACCTGA AAGAGGAAAT GTCTGAGAAT 1800 1801 TCTGCTTTTC AAGAGGAAGA GCAGTGTTAT GTCAGAAGCA ATCATATGGA TCAAGCTGAT 1860 1861 GATATAACAA GGCAAGACAT GATGGATGAT AAAGACAAAT CTGTAACACC TATTGGTTTG 1920 1921 AAAGAAATTG ACAGAGATGT TCAGAATGTT GAAACAAGTG GTTCAGATAC AAGTTCCACA 1980 1981 AAGGGAAAAA ATGCCGTTGA TAAATTAGTT GAGCGTCTCA GAGATAGTAC ACCTGCAGGA 2040 2041 GTTCGAGAGG ATGAAAAAGT TGAAACTGTT CAAACTGAAG AGAAGCAACG GAGAAAAAGG 2100 2101 AAGCGAACTA TAATGAATGA TGAACAGGTG ACAATAATAG AAAGGGCCCT TTTGGATGAA 2160 2161 CCTGAAATGC AGCGAAATAC TGCTTCTATA CAATCGTGGG CTGATAAATT ATGTCATCAT 2220 2221 GGCTCAGAGG TTACATGTTC GCAGCTACGG AACTGGCTCA ACAATCGAAA GGCCAGGCTT 2280 2281 GCACGAGCAA GTAAGGATGC TCGCCCCCCT CCAGAGCCTG ATAATGCTTT TGCAGGAAAG 2340 2341 CAAGGTGGGC CACAACCAGG TCATCCATTC AAAGCACCTG ATAGTTCTGG TGAAGAGGCT 2400 2401 GCCCCCTCAA ATACCAGAGG CACTCGAAGC ATGTCAAGAA TTAGCACCAG TGAAAACCCA 2460 2461 GAGGCTCCAG AATTTGTTGA TTTTGGTGCT GCAGAATTTG TTCAGTGCAA GCCAGGTCAG 2520 2521 TTTGTAGTGC TTGTAGATGG ACGAGGTGAG GAGATTGGTA AGGGAAAAGT ACACCAGGTT 2580 2581 CAAGGTAAAT GGTGTGGAAA GAGCTTGGAG GAATCAGGGA CGTGTGTTGT GGATGCCGTT 2640 2641 GACCTAAAGG CTGACAAATG GGTGAAGCTA CCCTACCCAT CTGAAGCCAC AGGTACCTCA 2700 2701 TTTGAAGAGG CTGAAACAAA ATTTGGGGTA ATGAGAGTGA TGTGGGATTC AAACAAAATA 2760 2761 TTCTTGTTGC GACCTCAATA A 2781

Protein Sequence (FASTA)

1     MGSDRSLFIP  PHVAKLLYLV  SFGQVHPWLL  IQVTHLPSRT  TLRSSNPFLS  RSLYPQKRTL  60
61    GQVGKEKSSC  SHGGYWVISI  LTLQNIPRVF  SYSIPIWVFI  RLFTSRFLNM  RQGKEEAVCS  120
121   VEQAIDLISV  VKEIHGLSAK  EINKLLRDSE  NFTIHFVTEK  GSEVKIDVEK  LAGCLPLHLI  180
181   AVLMSSDRDE  ALLRYLLCGI  RLLHSLCELA  PRHTKLEQSL  LDDVKVSEQL  IDLVFYVLVV  240
241   LNDYRQDIHK  SSPVPLLHSA  LVACSLYLLT  GCISSQWQDL  ALVIVAHPKV  DMFMDVACRA  300
301   VHLVVRFLQN  KLSAEHTDIC  AKLSPTAEFI  VNYLCQQCEA  SLQFLQLLCQ  QKPFRERLLR  360
361   NKELCGKGGI  LFLAQSILKL  HAPYFVESST  VMAALSRMKA  KVLSILLNLC  EAESISYLDE  420
421   VASSPGSLDL  AKSVALEVLE  LLKTGLSKDP  KQLTASSDRT  YPMGLLQLNA  MRLADIFSDD  480
481   SNFRSYITVH  FTDFLSAIFS  LSHGDFLSMW  CSADLPVREE  DGTLYYEIFP  AVGWALESLS  540
541   SSDLTNTRDL  YFNFIYNNMS  QASYVHQRTS  LFVKVIANLH  CFVPNICEEQ  ERNLFLHKFL  600
601   GCLRNDPSKL  LPSFIFVSGP  QKAAAIYRNL  RSLLSHAESL  IPTFLNEDDL  QLLRVFFDQL  660
661   QSLINPAEFE  ENRVQEDRSL  GGCSSPLLRT  EPPNRNNRNG  NLKEEMSENS  AFQEEEQCYV  720
721   RSNHMDQADD  ITRQDMMDDK  DKSVTPIGLK  EIDRDVQNVE  TSGSDTSSTK  GKNAVDKLVE  780
781   RLRDSTPAGV  REDEKVETVQ  TEEKQRRKRK  RTIMNDEQVT  IIERALLDEP  EMQRNTASIQ  840
841   SWADKLCHHG  SEVTCSQLRN  WLNNRKARLA  RASKDARPPP  EPDNAFAGKQ  GGPQPGHPFK  900
901   APDSSGEEAA  PSNTRGTRSM  SRISTSENPE  APEFVDFGAA  EFVQCKPGQF  VVLVDGRGEE  960
961   IGKGKVHQVQ  GKWCGKSLEE  SGTCVVDAVD  LKADKWVKLP  YPSEATGTSF  EEAETKFGVM  1020
1021  RVMWDSNKIF  LLRPQ  1035

Nucleotide CDS Sequence (FASTA)

1     ATGAGGCAAG  GCAAGGAAGA  AGCAGTATGC  AGTGTTGAAC  AGGCCATTGA  CTTGATTTCA  60
61    GTGGTGAAGG  AGATTCATGG  GCTTAGTGCA  AAGGAGATTA  ATAAGTTGCT  GAGAGACTCC  120
121   GAAAATTTTA  CCATTCACTT  TGTTACTGAA  AAAGGATCAG  AAGTAAAGAT  TGATGTGGAA  180
181   AAACTTGCAG  GATGTCTTCC  TTTGCACCTT  ATTGCAGTGC  TCATGTCATC  TGATAGAGAT  240
241   GAAGCGCTGC  TCCGATATTT  ACTATGTGGC  ATCCGGCTTT  TACATTCCTT  GTGCGAATTA  300
301   GCCCCTCGCC  ACACTAAACT  TGAGCAGAGT  TTGCTTGATG  ATGTAAAAGT  ATCAGAACAG  360
361   CTGATTGATC  TGGTCTTTTA  TGTGCTGGTT  GTTCTCAATG  ATTACAGACA  GGACATCCAT  420
421   AAATCAAGTC  CTGTGCCTCT  TTTACATTCA  GCACTTGTGG  CATGCAGTCT  GTATCTATTG  480
481   ACTGGATGTA  TATCTTCACA  GTGGCAAGAT  CTGGCACTAG  TGATAGTGGC  ACATCCTAAG  540
541   GTTGACATGT  TTATGGATGT  AGCTTGCAGA  GCTGTTCATC  TAGTTGTCAG  GTTTCTCCAA  600
601   AACAAGCTGT  CTGCTGAGCA  TACTGATATC  TGTGCAAAGT  TGAGTCCAAC  TGCTGAATTC  660
661   ATAGTTAACT  ATCTTTGCCA  ACAATGTGAG  GCTTCTTTAC  AGTTCCTTCA  GTTATTGTGC  720
721   CAACAGAAAC  CATTTCGGGA  GCGCTTACTG  AGGAATAAGG  AACTATGCGG  AAAGGGTGGT  780
781   ATTCTTTTTC  TGGCTCAATC  CATCCTGAAG  TTGCATGCAC  CTTATTTTGT  AGAATCTTCC  840
841   ACGGTCATGG  CTGCATTATC  TAGGATGAAA  GCTAAAGTTC  TGTCAATTTT  ATTGAATTTG  900
901   TGTGAAGCAG  AAAGCATTTC  TTATCTTGAT  GAGGTTGCCA  GCTCTCCAGG  AAGCCTGGAT  960
961   TTGGCAAAGT  CTGTTGCACT  TGAGGTCCTT  GAGTTGTTGA  AGACTGGACT  CAGTAAAGAT  1020
1021  CCCAAGCAGC  TCACTGCTAG  TTCTGATAGA  ACCTATCCTA  TGGGGCTTCT  GCAACTTAAT  1080
1081  GCAATGCGTC  TAGCTGATAT  CTTCTCTGAT  GATTCAAACT  TTCGATCTTA  CATCACTGTG  1140
1141  CACTTTACTG  ACTTTTTGAG  TGCAATATTT  TCACTCTCTC  ATGGAGATTT  TCTATCCATG  1200
1201  TGGTGTTCGG  CTGATCTCCC  TGTAAGGGAA  GAAGATGGTA  CCCTGTATTA  TGAAATATTT  1260
1261  CCTGCAGTTG  GATGGGCTTT  AGAGTCACTT  TCATCATCAG  ACCTAACAAA  TACAAGAGAT  1320
1321  CTGTATTTCA  ATTTTATTTA  TAACAACATG  TCTCAAGCAT  CCTATGTACA  TCAAAGAACA  1380
1381  TCTTTATTTG  TCAAAGTAAT  TGCAAACCTC  CATTGTTTTG  TTCCAAACAT  CTGTGAAGAG  1440
1441  CAGGAGAGGA  ACCTCTTCCT  TCACAAATTT  CTTGGATGCT  TGCGAAACGA  TCCATCTAAG  1500
1501  CTATTACCCA  GTTTTATCTT  TGTCTCTGGT  CCACAAAAGG  CTGCTGCTAT  TTACAGGAAC  1560
1561  CTGCGTTCCC  TGTTAAGTCA  TGCGGAATCT  TTAATTCCCA  CTTTTCTGAA  TGAGGATGAC  1620
1621  TTGCAGCTCT  TAAGGGTATT  CTTTGACCAA  TTACAATCAC  TGATAAACCC  TGCTGAATTT  1680
1681  GAAGAAAACC  GAGTTCAGGA  GGATCGAAGT  CTAGGGGGGT  GCTCATCTCC  TTTACTGAGA  1740
1741  ACGGAACCTC  CAAATCGTAA  TAACCGAAAT  GGTAACCTGA  AAGAGGAAAT  GTCTGAGAAT  1800
1801  TCTGCTTTTC  AAGAGGAAGA  GCAGTGTTAT  GTCAGAAGCA  ATCATATGGA  TCAAGCTGAT  1860
1861  GATATAACAA  GGCAAGACAT  GATGGATGAT  AAAGACAAAT  CTGTAACACC  TATTGGTTTG  1920
1921  AAAGAAATTG  ACAGAGATGT  TCAGAATGTT  GAAACAAGTG  GTTCAGATAC  AAGTTCCACA  1980
1981  AAGGGAAAAA  ATGCCGTTGA  TAAATTAGTT  GAGCGTCTCA  GAGATAGTAC  ACCTGCAGGA  2040
2041  GTTCGAGAGG  ATGAAAAAGT  TGAAACTGTT  CAAACTGAAG  AGAAGCAACG  GAGAAAAAGG  2100
2101  AAGCGAACTA  TAATGAATGA  TGAACAGGTG  ACAATAATAG  AAAGGGCCCT  TTTGGATGAA  2160
2161  CCTGAAATGC  AGCGAAATAC  TGCTTCTATA  CAATCGTGGG  CTGATAAATT  ATGTCATCAT  2220
2221  GGCTCAGAGG  TTACATGTTC  GCAGCTACGG  AACTGGCTCA  ACAATCGAAA  GGCCAGGCTT  2280
2281  GCACGAGCAA  GTAAGGATGC  TCGCCCCCCT  CCAGAGCCTG  ATAATGCTTT  TGCAGGAAAG  2340
2341  CAAGGTGGGC  CACAACCAGG  TCATCCATTC  AAAGCACCTG  ATAGTTCTGG  TGAAGAGGCT  2400
2401  GCCCCCTCAA  ATACCAGAGG  CACTCGAAGC  ATGTCAAGAA  TTAGCACCAG  TGAAAACCCA  2460
2461  GAGGCTCCAG  AATTTGTTGA  TTTTGGTGCT  GCAGAATTTG  TTCAGTGCAA  GCCAGGTCAG  2520
2521  TTTGTAGTGC  TTGTAGATGG  ACGAGGTGAG  GAGATTGGTA  AGGGAAAAGT  ACACCAGGTT  2580
2581  CAAGGTAAAT  GGTGTGGAAA  GAGCTTGGAG  GAATCAGGGA  CGTGTGTTGT  GGATGCCGTT  2640
2641  GACCTAAAGG  CTGACAAATG  GGTGAAGCTA  CCCTACCCAT  CTGAAGCCAC  AGGTACCTCA  2700
2701  TTTGAAGAGG  CTGAAACAAA  ATTTGGGGTA  ATGAGAGTGA  TGTGGGATTC  AAACAAAATA  2760
2761  TTCTTGTTGC  GACCTCAATA  A  2781

Nucleotide Sequence

>LLPS-Thc-2139|TCM_030609
ATGAGGCAAGGCAAGGAAGAAGCAGTATGCAGTGTTGAACAGGCCATTGACTTGATTTCAGTGGTGAAGGAGATTCATGGGCTTAGTGCAAAGGAGATTAATAAGTTGCTGAGAGACTCCGAAAATTTTACCATTCACTTTGTTACTGAAAAAGGATCAGAAGTAAAGATTGATGTGGAAAAACTTGCAGGATGTCTTCCTTTGCACCTTATTGCAGTGCTCATGTCATCTGATAGAGATGAAGCGCTGCTCCGATATTTACTATGTGGCATCCGGCTTTTACATTCCTTGTGCGAATTAGCCCCTCGCCACACTAAACTTGAGCAGAGTTTGCTTGATGATGTAAAAGTATCAGAACAGCTGATTGATCTGGTCTTTTATGTGCTGGTTGTTCTCAATGATTACAGACAGGACATCCATAAATCAAGTCCTGTGCCTCTTTTACATTCAGCACTTGTGGCATGCAGTCTGTATCTATTGACTGGATGTATATCTTCACAGTGGCAAGATCTGGCACTAGTGATAGTGGCACATCCTAAGGTTGACATGTTTATGGATGTAGCTTGCAGAGCTGTTCATCTAGTTGTCAGGTTTCTCCAAAACAAGCTGTCTGCTGAGCATACTGATATCTGTGCAAAGTTGAGTCCAACTGCTGAATTCATAGTTAACTATCTTTGCCAACAATGTGAGGCTTCTTTACAGTTCCTTCAGTTATTGTGCCAACAGAAACCATTTCGGGAGCGCTTACTGAGGAATAAGGAACTATGCGGAAAGGGTGGTATTCTTTTTCTGGCTCAATCCATCCTGAAGTTGCATGCACCTTATTTTGTAGAATCTTCCACGGTCATGGCTGCATTATCTAGGATGAAAGCTAAAGTTCTGTCAATTTTATTGAATTTGTGTGAAGCAGAAAGCATTTCTTATCTTGATGAGGTTGCCAGCTCTCCAGGAAGCCTGGATTTGGCAAAGTCTGTTGCACTTGAGGTCCTTGAGTTGTTGAAGACTGGACTCAGTAAAGATCCCAAGCAGCTCACTGCTAGTTCTGATAGAACCTATCCTATGGGGCTTCTGCAACTTAATGCAATGCGTCTAGCTGATATCTTCTCTGATGATTCAAACTTTCGATCTTACATCACTGTGCACTTTACTGACTTTTTGAGTGCAATATTTTCACTCTCTCATGGAGATTTTCTATCCATGTGGTGTTCGGCTGATCTCCCTGTAAGGGAAGAAGATGGTACCCTGTATTATGAAATATTTCCTGCAGTTGGATGGGCTTTAGAGTCACTTTCATCATCAGACCTAACAAATACAAGAGATCTGTATTTCAATTTTATTTATAACAACATGTCTCAAGCATCCTATGTACATCAAAGAACATCTTTATTTGTCAAAGTAATTGCAAACCTCCATTGTTTTGTTCCAAACATCTGTGAAGAGCAGGAGAGGAACCTCTTCCTTCACAAATTTCTTGGATGCTTGCGAAACGATCCATCTAAGCTATTACCCAGTTTTATCTTTGTCTCTGGTCCACAAAAGGCTGCTGCTATTTACAGGAACCTGCGTTCCCTGTTAAGTCATGCGGAATCTTTAATTCCCACTTTTCTGAATGAGGATGACTTGCAGCTCTTAAGGGTATTCTTTGACCAATTACAATCACTGATAAACCCTGCTGAATTTGAAGAAAACCGAGTTCAGGAGGATCGAAGTCTAGGGGGGTGCTCATCTCCTTTACTGAGAACGGAACCTCCAAATCGTAATAACCGAAATGGTAACCTGAAAGAGGAAATGTCTGAGAATTCTGCTTTTCAAGAGGAAGAGCAGTGTTATGTCAGAAGCAATCATATGGATCAAGCTGATGATATAACAAGGCAAGACATGATGGATGATAAAGACAAATCTGTAACACCTATTGGTTTGAAAGAAATTGACAGAGATGTTCAGAATGTTGAAACAAGTGGTTCAGATACAAGTTCCACAAAGGGAAAAAATGCCGTTGATAAATTAGTTGAGCGTCTCAGAGATAGTACACCTGCAGGAGTTCGAGAGGATGAAAAAGTTGAAACTGTTCAAACTGAAGAGAAGCAACGGAGAAAAAGGAAGCGAACTATAATGAATGATGAACAGGTGACAATAATAGAAAGGGCCCTTTTGGATGAACCTGAAATGCAGCGAAATACTGCTTCTATACAATCGTGGGCTGATAAATTATGTCATCATGGCTCAGAGGTTACATGTTCGCAGCTACGGAACTGGCTCAACAATCGAAAGGCCAGGCTTGCACGAGCAAGTAAGGATGCTCGCCCCCCTCCAGAGCCTGATAATGCTTTTGCAGGAAAGCAAGGTGGGCCACAACCAGGTCATCCATTCAAAGCACCTGATAGTTCTGGTGAAGAGGCTGCCCCCTCAAATACCAGAGGCACTCGAAGCATGTCAAGAATTAGCACCAGTGAAAACCCAGAGGCTCCAGAATTTGTTGATTTTGGTGCTGCAGAATTTGTTCAGTGCAAGCCAGGTCAGTTTGTAGTGCTTGTAGATGGACGAGGTGAGGAGATTGGTAAGGGAAAAGTACACCAGGTTCAAGGTAAATGGTGTGGAAAGAGCTTGGAGGAATCAGGGACGTGTGTTGTGGATGCCGTTGACCTAAAGGCTGACAAATGGGTGAAGCTACCCTACCCATCTGAAGCCACAGGTACCTCATTTGAAGAGGCTGAAACAAAATTTGGGGTAATGAGAGTGATGTGGGATTCAAACAAAATATTCTTGTTGCGACCTCAATAA

DrLLPS ID	Organism	Identity	E-value	Score
LLPS-Coc-1031	Corchorus capsularis	86.76	0.0	1495
LLPS-Gor-2016	Gossypium raimondii	86.52	0.0	1554
LLPS-Vir-1530	Vigna radiata	67.02	1e-155	474
LLPS-Mae-2059	Manihot esculenta	66.94	0.0	1191
LLPS-Viv-2275	Vitis vinifera	63.72	0.0	1107
LLPS-Pot-2430	Populus trichocarpa	63.01	0.0	960
LLPS-Prp-1922	Prunus persica	62.95	0.0	1082
LLPS-Cus-0153	Cucumis sativus	61.0	0.0	1022
LLPS-Glm-2203	Glycine max	59.0	0.0	1000
LLPS-Phv-1866	Phaseolus vulgaris	58.63	0.0	980
LLPS-Via-1510	Vigna angularis	57.59	0.0	927
LLPS-Sol-2212	Solanum lycopersicum	55.15	0.0	878
LLPS-Nia-1895	Nicotiana attenuata	53.63	0.0	867
LLPS-Met-2259	Medicago truncatula	52.6	0.0	870
LLPS-Amt-0552	Amborella trichopoda	51.05	2e-171	538
LLPS-Ori-2272	Oryza indica	50.85	2e-111	372
LLPS-Orbr-1784	Oryza brachyantha	49.36	1e-136	443
LLPS-Org-1847	Oryza glaberrima	48.7	9e-135	437
LLPS-Dac-0024	Daucus carota	48.32	0.0	721
LLPS-Arl-0038	Arabidopsis lyrata	48.26	0.0	680
LLPS-Brd-2206	Brachypodium distachyon	48.24	6e-133	432
LLPS-Sei-1944	Setaria italica	48.07	1e-133	434
LLPS-Art-0295	Arabidopsis thaliana	47.91	0.0	687
LLPS-Sob-0889	Sorghum bicolor	47.8	5e-128	421
LLPS-Tra-0878	Triticum aestivum	46.88	1e-135	439
LLPS-Orb-0064	Oryza barthii	46.8	2e-89	311
LLPS-Hov-0911	Hordeum vulgare	46.59	1e-133	434
LLPS-Zem-1556	Zea mays	46.45	4e-123	405
LLPS-Orr-1248	Oryza rufipogon	46.21	2e-121	401
LLPS-Orp-2038	Oryza punctata	45.57	4e-115	383
LLPS-Orni-1545	Oryza nivara	45.57	2e-115	384
LLPS-Orgl-0542	Oryza glumaepatula	45.39	2e-114	382
LLPS-Brr-0973	Brassica rapa	44.99	0.0	669
LLPS-Lep-1481	Leersia perrieri	44.92	7e-120	396
LLPS-Brn-1202	Brassica napus	44.66	0.0	663
LLPS-Bro-2525	Brassica oleracea	44.34	0.0	662
LLPS-Hea-0009	Helianthus annuus	44.33	0.0	626
LLPS-Tru-0734	Triticum urartu	44.3	1e-45	182
LLPS-Orm-1848	Oryza meridionalis	44.12	7e-79	281
LLPS-Ors-2299	Oryza sativa	43.6	4e-26	118
LLPS-Mua-1243	Musa acuminata	38.66	9e-133	429
LLPS-Php-1533	Physcomitrella patens	38.33	4e-98	340
LLPS-Sem-1110	Selaginella moellendorffii	37.06	8e-80	286

DrLLPS ID

Organism

Identity

E-value

Score

LLPS-Coc-1031

Corchorus capsularis

86.76

0.0

1495

LLPS-Gor-2016

Gossypium raimondii