LLPS-Art-0323
HON4

▼ OVERVIEW


Status: Reviewed
Protein Name: At3g18035
Gene Name: HON4, HISTONE H1, At3g18035
Ensembl Gene: AT3G18035
Ensembl Protein: AT3G18035.2
Organism: Arabidopsis thaliana
Taxa ID: 3702
LLPS Type: Client


▼ PROPERTY



——— Disorder propensity (calculated by IUPred2A)

▼ Classification


Condensates:
CondensateDescriptionTissue/CellPMIDs
Nucleolus
"...We identified 1602 proteins in the nucleolar and 2544 proteins in the nuclear fraction with an overlap of 1429 proteins."
Arabidopsis thaliana cells26980300

▼ SEQUENCE


Protein Sequence (FASTA)
1     MDPSLGDPHH  PPQFTPFPHF  PTSNHHPLGP  NPYNNHVVFQ  PQPQTQTQIP  QPQMFQLSPH  60
61    VSMPHPPYSE  MICAAIAALN  EPDGSSKMAI  SRYIERCYTG  LTSAHAALLT  HHLKTLKTSG  120
121   VLSMVKKSYK  IAGSSTPPAS  VAVAAAAAAQ  GLDVPRSEIL  HSSNNDPMAS  GSASQPLKRG  180
181   RGRPPKPKPE  SQPQPLQQLP  PTNQVQANGQ  PIWEQQQVQS  PVPVPTPVTE  SAKRGPGRPR  240
241   KNGSAAPATA  PIVQASVMAG  IMKRRGRPPG  RRAAGRQRKP  KSVSSTASVY  PYVANGARRR  300
301   GRPRRVVDPS  SIVSVAPVGG  ENVAAVAPGM  KRGRGRPPKI  GGVISRLIMK  PKRGRGRPVG  360
361   RPRKIGTSVT  TGTQDSGELK  KKFDIFQEKV  KEIVKVLKDG  VTSENQAVVQ  AIKDLEALTV  420
421   TETVEPQVME  EVQPEETAAP  QTEAQQTEAA  ETQGGQEEGQ  EREGETQTQT  EAEAMQEALF  480
Nucleotide CDS Sequence (FASTA)
1     ATGGATCCAT  CTCTTGGTGA  TCCTCATCAT  CCTCCTCAGT  TCACCCCTTT  TCCTCATTTT  60
61    CCCACCTCCA  ATCATCATCC  TTTAGGACCA  AATCCGTACA  ATAACCATGT  CGTCTTCCAA  120
121   CCGCAGCCGC  AAACGCAAAC  GCAAATCCCG  CAACCGCAGA  TGTTTCAGTT  ATCTCCACAT  180
181   GTTTCAATGC  CCCACCCTCC  TTACTCCGAA  ATGATTTGCG  CTGCGATTGC  GGCGTTAAAC  240
241   GAACCGGATG  GTTCGAGCAA  GATGGCAATT  TCGAGATACA  TCGAGAGATG  TTACACCGGT  300
301   TTAACTTCTG  CTCATGCTGC  TTTGTTGACT  CACCATCTCA  AGACTTTGAA  GACCAGTGGT  360
361   GTTCTTTCTA  TGGTTAAGAA  ATCTTACAAA  ATTGCTGGTT  CTTCTACTCC  TCCTGCTAGT  420
421   GTAGCTGTTG  CTGCTGCTGC  CGCCGCTCAA  GGTCTCGATG  TTCCCAGATC  TGAGATTCTC  480
481   CATTCAAGTA  ACAACGATCC  CATGGCTTCT  GGCTCTGCTT  CTCAGCCTCT  GAAACGAGGT  540
541   CGTGGTCGTC  CTCCTAAGCC  TAAACCTGAA  TCTCAACCAC  AACCACTACA  GCAACTTCCA  600
601   CCGACCAATC  AAGTCCAGGC  TAACGGACAG  CCAATCTGGG  AACAGCAGCA  AGTTCAATCA  660
661   CCTGTTCCGG  TTCCGACTCC  GGTTACAGAG  TCGGCGAAGA  GAGGACCTGG  TCGTCCAAGG  720
721   AAGAACGGTT  CTGCTGCTCC  TGCTACTGCA  CCAATCGTTC  AAGCTTCGGT  TATGGCTGGA  780
781   ATTATGAAAC  GTAGAGGTAG  ACCACCGGGT  CGTCGAGCTG  CTGGGAGACA  GAGGAAGCCC  840
841   AAATCCGTTT  CTTCTACTGC  CTCTGTGTAT  CCTTATGTTG  CTAATGGTGC  TAGACGCAGA  900
901   GGAAGGCCTA  GGAGAGTTGT  TGACCCTAGC  AGTATTGTTA  GTGTTGCTCC  AGTAGGTGGT  960
961   GAAAATGTGG  CAGCGGTTGC  GCCAGGGATG  AAGCGTGGAC  GTGGACGACC  ACCTAAGATT  1020
1021  GGTGGTGTTA  TCAGTAGGCT  TATTATGAAG  CCTAAGAGAG  GACGAGGACG  TCCTGTAGGT  1080
1081  AGACCCAGAA  AGGTAAATTT  TCACATCCCC  CAATTCTGTA  TTCGTGATCT  CGATTTTGCA  1140
1141  ATATCTGACG  TTTACTGTGC  ATGA  1164

▼ ANNOTATION


Disorder
IUPred2A
Interaction
HINT
Physicochemical
Compute pI/MwAAindex
Localization
COMPARTMENTS

▼ ORTHOLOGY


DrLLPS IDOrganismIdentityE-valueScore
LLPS-Arl-1119Arabidopsis lyrata83.887e-105 328
LLPS-Mae-1196Manihot esculenta68.573e-0963.2
LLPS-Met-1221Medicago truncatula67.572e-0654.7
LLPS-Brn-0501Brassica napus64.622e-37 147
LLPS-Thc-1942Theobroma cacao63.161e-0860.8
LLPS-Brr-2144Brassica rapa62.272e-33 135
LLPS-Bro-0014Brassica oleracea61.646e-39 152
LLPS-Glm-2743Glycine max61.432e-0860.1
LLPS-Phv-1872Phaseolus vulgaris60.07e-0962.0
LLPS-Hea-0917Helianthus annuus59.77e-0755.5
LLPS-Via-1575Vigna angularis58.679e-0961.6
LLPS-Vir-1457Vigna radiata58.679e-0961.6
LLPS-Gor-0961Gossypium raimondii57.143e-0757.0