• Disorder
  • Domain
  • PTM
  • Variation
  • Mutation
  • Interaction
  • Disease
  • Drug
  • Physicochemical
  • Function
  • Proteomics
  • Structure
  • Localization
  • Expression
  • Element
  • Methylation

LLPS-Sob-a053
SORBI_3009G104800

Integrated Annotations

▼ OVERVIEW


Status: Unreviewed
Protein Name: Uncharacterized protein
Gene Name: SORBI_3009G104800
Ensembl Gene: SORBI_3009G104800
Ensembl Protein: EES18046
Organism: Sorghum bicolor
Taxa ID: 4558
LLPS Type: Others


▼ PROPERTY



——— Disorder propensity (calculated by IUPred2A)

▼ Classification


Condensates:
CondensateEvidenceOrthologs
OthersPredicted from orthologs(View)

▼ CROSS REFERENCE


DatabaseNucleotide IDProtein ID
EnsemblEES18046EES18046
EnsemblOQU77807OQU77807
UniProtC5YWD0, C5YWD0_SORBI
GeneBankCM000768EES18046.1
RefSeqXM_002439571.1XP_002439616.1

▼ SEQUENCE


Protein Sequence (FASTA)
1     MDSSGSASSY  KLQLALAALV  GASSAAVAAY  YLHYRAVAQV  ARSASTNRRR  TRPPTPAPAA  60
61    SGRKLPPPRR  DAVGSASLPD  LSAFYDAGGH  GGGGLASSGY  LVEEEEEDDA  HGVVGPHANG  120
121   GALEHAELLD  IPQGLPRLNV  GPDGSKPFAR  TVSTRRVEII  RPKSPKSPAA  SASALESADG  180
181   SGDAIQNSDN  GYMNTNGNLE  GEHKGNAIVE  NGAAKPLAAA  SLMRSKSISN  GLHAVQPDPV  240
241   AADILRKEAQ  QESFIKMLTT  PEEIPTADEI  EVFKILQKCL  ELRDSYLFRE  EVTPWEKEAI  300
301   NDPCTPKPNP  NPFTYVPEPK  SEHVFQMVDG  VVHVYADKDC  TESIYPVADA  TTFFTDLHYI  360
361   LRVTAAGNTR  TVCHNRLNLL  EHKFKFHLML  NADREFLAQK  TAPHRDFYNV  RKVDTHVHHS  420
421   ACMNQKHLLR  FIKSKLRKEP  DEVVIFRDGT  YMTLKEVFES  LDLTGYDLNV  DLLDVHADKS  480
481   TFHRFDKFNL  KYNPCGQSRL  REIFLKQDNL  IQGRFLAELT  KQVFSDLSAS  KYQLAEYRIS  540
541   IYGRKQSEWD  QLASWIVNNE  LHNENVVWLV  QIPRLYNVYK  GMGIVTSFQN  LLDNIFLPLF  600
601   EVTIDPASHP  QLHVFLKQVV  GLDLVDDESK  PERRPTKHHM  PTPEQWTNVF  NPAFSYYAYY  660
661   CYANLFTLNK  LRESKGMTTI  KFRPHAGEAG  DIDHLAATFL  LCHNISHGIN  LRKSPVLQYL  720
721   YYLGQIGLAM  SPLSNNSLFL  DYHRNPFPTF  FQRGLNVSLS  TDDPLQIHLT  KEPLVEEYSI  780
781   AASLWKLSSC  DLCEIARNSV  YQSGFSHAQK  SHWIGKNYFK  RGLAGNDIHR  TNVPHIRVQF  840
841   REMIWRNEMK  LVYSDNEILI  PDELDL  866
Nucleotide CDS Sequence (FASTA)
1     ATGAACACAA  ATGGAAACCT  GGAAGGCGAA  CACAAAGGAA  ATGCAATTGT  GGAAAATGGG  60
61    GCTGCCAAAC  CATTAGCTGC  AGCAAGCTTG  ATGCGGTCAA  AAAGTATATC  CAATGGTCTT  120
121   CATGCAGTTC  AACCTGACCC  AGTTGCTGCA  GATATTCTAC  GAAAAGAAGC  TCAGCAAGAA  180
181   TCATTTATCA  AGATGTTAAC  TACTCCAGAG  GAGATTCCAA  CTGCTGACGA  AATTGAGGTG  240
241   TTCAAAATCC  TTCAGAAGTG  CCTCGAGTTA  AGAGACTCTT  ATCTCTTTAG  AGAAGAGGTT  300
301   ACTCCATGGG  AGAAGGAGGC  CATAAATGAC  CCCTGTACTC  CAAAACCTAA  CCCCAACCCG  360
361   TTCACTTATG  TGCCTGAACC  AAAGTCAGAG  CATGTCTTCC  AAATGGTTGA  TGGTGTTGTC  420
421   CATGTTTATG  CGGATAAAGA  TTGTACAGAG  AGCATTTATC  CTGTGGCTGA  TGCCACAACC  480
481   TTCTTCACGG  ACCTGCATTA  TATTCTCCGA  GTAACGGCTG  CAGGGAACAC  AAGAACTGTC  540
541   TGCCATAATC  GGTTAAATCT  TCTTGAGCAT  AAGTTTAAAT  TTCATCTGAT  GTTAAATGCG  600
601   GATAGGGAAT  TTCTTGCCCA  GAAGACCGCA  CCGCATCGTG  ATTTTTACAA  TGTCAGGAAG  660
661   GTTGACACTC  ATGTTCATCA  TTCAGCATGC  ATGAATCAAA  AGCATCTGTT  GAGGTTCATA  720
721   AAATCCAAAC  TAAGGAAAGA  ACCTGATGAG  GTGGTCATTT  TCAGAGATGG  TACTTATATG  780
781   ACTTTAAAAG  AGGTTTTTGA  GAGCTTGGAC  TTAACTGGGT  ATGATCTGAA  TGTTGATTTG  840
841   CTAGATGTCC  ATGCAGACAA  AAGCACATTT  CATCGTTTTG  ACAAATTCAA  CCTAAAATAT  900
901   AATCCATGTG  GCCAAAGTAG  GCTCAGAGAA  ATTTTCCTCA  AACAAGACAA  TCTCATTCAA  960
961   GGCCGTTTTC  TTGCCGAGTT  GACAAAGCAA  GTTTTCTCTG  ACCTTTCTGC  TAGCAAATAT  1020
1021  CAGCTGGCAG  AATATAGGAT  TTCAATCTAT  GGGAGGAAAC  AAAGTGAATG  GGACCAACTT  1080
1081  GCGAGTTGGA  TAGTGAACAA  TGAATTGCAC  AATGAAAATG  TTGTCTGGCT  GGTTCAGATT  1140
1141  CCACGCTTAT  ATAACGTGTA  CAAGGGAATG  GGTATTGTTA  CGTCATTCCA  AAATCTTCTT  1200
1201  GACAACATTT  TCCTTCCTCT  TTTTGAGGTT  ACTATTGATC  CAGCTTCACA  CCCGCAGCTC  1260
1261  CATGTCTTCC  TGAAGCAGGT  TGTAGGGCTG  GACCTGGTTG  ATGATGAAAG  TAAACCAGAA  1320
1321  AGGCGTCCAA  CAAAGCACCA  CATGCCTACA  CCTGAACAGT  GGACCAATGT  GTTCAACCCT  1380
1381  GCATTTTCAT  ATTATGCATA  CTACTGCTAT  GCTAACTTAT  TCACCCTAAA  CAAGCTGCGT  1440
1441  GAGTCAAAGG  GGATGACCAC  TATCAAATTC  CGTCCACATG  CTGGAGAGGC  TGGAGATATC  1500
1501  GATCACTTGG  CTGCAACATT  TCTTCTTTGT  CACAACATAT  CACATGGAAT  CAATCTAAGG  1560
1561  AAGTCTCCTG  TGCTTCAGTA  CTTATACTAT  CTTGGTCAGA  TTGGTCTGGC  GATGTCGCCA  1620
1621  TTGAGCAACA  ACTCCTTGTT  TCTTGACTAT  CATCGCAACC  CTTTTCCAAC  GTTCTTCCAA  1680
1681  CGAGGTCTGA  ATGTCTCATT  ATCTACGGAT  GACCCTTTGC  AAATTCACCT  GACAAAAGAA  1740
1741  CCATTGGTGG  AAGAATACAG  CATTGCTGCT  TCGCTGTGGA  AGCTCAGTTC  TTGTGATTTA  1800
1801  TGTGAAATTG  CAAGGAACTC  CGTTTATCAA  TCTGGATTTT  CACATGCTCA  AAAGTCTCAC  1860
1861  TGGATTGGCA  AGAACTACTT  CAAAAGAGGA  CTTGCTGGAA  ATGACATTCA  CAGAACGAAT  1920
1921  GTACCACACA  TCAGGGTTCA  ATTTAGAGAA  ATGATCTGGA  GAAATGAAAT  GAAACTAGTT  1980
1981  TACTCTGACA  ATGAGATCTT  AATACCAGAC  GAGCTGGATC  TGTAA  2025