• Disorder
  • Domain
  • PTM
  • Variation
  • Mutation
  • Interaction
  • Disease
  • Drug
  • Physicochemical
  • Function
  • Proteomics
  • Structure
  • Localization
  • Expression
  • Element
  • Methylation

LLPS-Pat-1685
HAP1

Integrated Annotations

▼ OVERVIEW


Status: Unreviewed
Protein Name: Huntingtin associated protein 1
Gene Name: HAP1
Ensembl Gene: ENSPTRG00000009177.5
Ensembl Protein: ENSPTRP00000093060.1
Organism: Pan troglodytes
Taxa ID: 9598
LLPS Type: Others


▼ PROPERTY



——— Disorder propensity (calculated by IUPred2A)

▼ Classification


Condensates:
CondensateEvidenceOrthologs
Centrosome/Spindle pole bodyPredicted from orthologs(View)

▼ SEQUENCE


Protein Sequence (FASTA)
1     MRPKRSGRCC  AGSRLGPGDP  AALTCAPSPS  ASPAPEPSAQ  PQARGTGQRA  GSLAASGSQF  60
61    LSEARTGARP  ASEAGAKAGA  RRPSAFSAIQ  GDVRSMPDNS  DAPWTRFVFQ  GPFGSRATGR  120
121   GTGKAAGIWK  TPASYVGRRP  GVSGPERAAF  IRELEEALCP  NLPLPVKKIT  QEDVKVMLYL  180
181   LEELLPPVWE  SVTYGMVLLQ  RERDLNTAAR  IGQSLVKQNS  VLMEENSKLE  ALLGSAKEEI  240
241   LHLRHQVNLR  DELLQLYSDS  DEEDEDEEEE  EEEEQEEEEA  EEDQQCAHPC  DAPKLILQEA  300
301   LLHQHHCPQL  EALQEKLRLL  EEENHQLREE  ASQLDTLEDE  EQMLILECVE  QFSEASQQMA  360
361   ELSEVLVLRL  ENYERQQQEV  ARLQAQVLKL  QQRCRMYGAE  TEKLQKQLAS  EKEIQMQLQE  420
421   ESVWVGSQLQ  DLREKYMDCG  GMLIETQEEV  KTLRQQPPVS  TGSATHYPYS  VPLETLPGFQ  480
481   ETLAEERRTS  LRRMISDPVY  FMERNYEMPR  GDTSSLRYDF  RYSEDREQVQ  GFEAEEGLML  540
541   AADIMRGEDF  TPAEELVPQE  ELGAAKKVPA  EEGVMEEAEL  VSEETEGWEE  VELELDEATR  600
601   MNVVTSALEA  SGLGPSHLDM  NYVLQQLANW  QDAHYRRQLR  WKMLQKSECP  HGALPAASRT  660
661   SCRSSCR  667
Nucleotide CDS Sequence (FASTA)
1     ATGCGCCCGA  AGAGGTCGGG  CCGGTGCTGC  GCGGGGAGCC  GGCTCGGACC  CGGGGACCCA  60
61    GCAGCCCTCA  CCTGTGCACC  TTCGCCCTCA  GCCAGTCCCG  CTCCGGAGCC  CTCTGCGCAG  120
121   CCGCAGGCAC  GGGGCACTGG  ACAGAGAGCA  GGATCCCTAG  CCGCCTCTGG  ATCCCAGTTC  180
181   CTCTCGGAAG  CCCGCACCGG  AGCTCGCCCG  GCCTCCGAGG  CTGGAGCCAA  GGCAGGAGCC  240
241   CGGCGCCCGT  CCGCATTCTC  GGCCATCCAA  GGGGATGTCC  GGTCTATGCC  CGACAATTCG  300
301   GACGCGCCGT  GGACCCGCTT  CGTATTCCAA  GGGCCGTTTG  GTTCCCGGGC  CACTGGCCGG  360
361   GGGACTGGAA  AGGCAGCGGG  CATCTGGAAG  ACGCCAGCCT  CCTACGTTGG  CCGGCGACCC  420
421   GGGGTGTCCG  GCCCTGAGCG  CGCCGCCTTT  ATTCGGGAGC  TGGAGGAAGC  ACTGTGTCCT  480
481   AACCTACCTC  TGCCAGTCAA  AAAGATCACC  CAGGAAGACG  TCAAAGTGAT  GTTATATTTG  540
541   CTGGAGGAGC  TTCTCCCACC  TGTCTGGGAG  AGCGTTACCT  ATGGGATGGT  CCTTCTGCAG  600
601   AGAGAGAGGG  ACCTGAACAC  TGCAGCTCGC  ATTGGCCAGT  CCCTGGTGAA  ACAGAACAGT  660
661   GTTTTGATGG  AGGAGAACAG  CAAGCTGGAA  GCCCTGCTGG  GCTCAGCCAA  GGAGGAGATT  720
721   TTACACCTCA  GACACCAGGT  GAACTTGCGG  GATGAGCTCC  TCCAGCTCTA  CTCAGATTCT  780
781   GATGAGGAGG  ATGAGGATGA  AGAAGAGGAG  GAGGAAGAGG  AACAGGAAGA  AGAGGAAGCA  840
841   GAGGAAGACC  AGCAGTGTGC  TCATCCCTGT  GATGCCCCTA  AGCTGATTTT  GCAGGAGGCA  900
901   TTGCTGCACC  AGCACCACTG  CCCACAGCTG  GAAGCCTTGC  AGGAGAAGCT  GAGGCTGCTG  960
961   GAGGAGGAGA  ATCATCAGCT  GAGAGAAGAG  GCCTCTCAAC  TCGACACTCT  TGAGGATGAG  1020
1021  GAACAGATGC  TCATTCTGGA  GTGTGTGGAG  CAGTTTTCGG  AGGCCAGCCA  ACAGATGGCT  1080
1081  GAGCTGTCAG  AGGTGCTGGT  GCTCAGGCTG  GAAAACTATG  AACGGCAGCA  GCAGGAGGTC  1140
1141  GCTCGGCTGC  AGGCCCAGGT  GCTGAAGCTG  CAGCAGCGCT  GCCGGATGTA  TGGGGCTGAG  1200
1201  ACTGAAAAGT  TGCAGAAGCA  GCTGGCTTCA  GAGAAGGAAA  TCCAGATGCA  GCTCCAGGAA  1260
1261  GAGAGCGTGT  GGGTGGGTTC  CCAGCTGCAG  GACCTGCGGG  AGAAGTACAT  GGATTGTGGG  1320
1321  GGCATGCTGA  TTGAGACGCA  GGAGGAGGTG  AAGACCCTCC  GCCAGCAACC  CCCGGTGTCC  1380
1381  ACTGGGTCTG  CCACCCATTA  CCCATACAGC  GTGCCTCTGG  AGACTCTTCC  TGGTTTCCAG  1440
1441  GAGACGCTGG  CTGAGGAGCG  CAGAACGTCT  CTAAGGAGGA  TGATCTCAGA  CCCTGTGTAT  1500
1501  TTTATGGAGA  GGAATTATGA  GATGCCCAGA  GGGGACACAT  CCAGCCTAAG  GTATGATTTT  1560
1561  CGCTACAGTG  AGGATCGAGA  GCAGGTGCAG  GGGTTTGAGG  CTGAGGAAGG  GTTGATGCTG  1620
1621  GCAGCGGATA  TTATGCGGGG  GGAAGATTTC  ACGCCTGCGG  AGGAGTTGGT  GCCCCAGGAG  1680
1681  GAGCTGGGGG  CTGCCAAGAA  GGTGCCGGCT  GAGGAAGGGG  TGATGGAAGA  GGCAGAGCTG  1740
1741  GTGTCAGAGG  AGACCGAGGG  CTGGGAGGAG  GTGGAACTGG  AGCTGGATGA  GGCAACGCGG  1800
1801  ATGAACGTGG  TGACATCAGC  CCTGGAGGCC  AGCGGCTTGG  GCCCTTCACA  CCTGGACATG  1860
1861  AATTATGTCC  TCCAGCAGCT  GGCCAACTGG  CAAGATGCCC  ATTACAGGCG  GCAGCTGAGG  1920
1921  TGGAAGATGC  TCCAGAAAAG  TGAGTGCCCC  CACGGGGCCC  TCCCTGCCGC  CAGCCGGACA  1980
1981  AGCTGCAGAT  CGTCGTGCCG  ATGA  2004

▼ ORTHOLOGY


DrLLPS IDOrganismIdentityE-valueScore
LLPS-Pap-1778Pan paniscus98.480.01113
LLPS-Gog-1066Gorilla gorilla97.050.0 556
LLPS-Hos-2545Homo sapiens96.220.01078
LLPS-Poa-2201Pongo abelii91.480.01007
LLPS-Nol-4300Nomascus leucogenys87.650.0 915
LLPS-Cea-0534Cercocebus atys86.752e-63 225
LLPS-Paa-3738Papio anubis85.795e-81 273
LLPS-Mal-3942Mandrillus leucophaeus84.627e-55 200
LLPS-Rhb-1014Rhinopithecus bieti82.70.0 885
LLPS-Man-4575Macaca nemestrina75.684e-147 444
LLPS-Otg-3806Otolemur garnettii74.060.0 741
LLPS-Ict-1225Ictidomys tridecemlineatus71.660.0 712
LLPS-Tut-2233Tursiops truncatus70.860.0 736
LLPS-Sus-2897Sus scrofa69.970.0 658
LLPS-Maf-3363Macaca fascicularis69.240.0 676
LLPS-Mam-4064Macaca mulatta68.940.0 671
LLPS-Cas-0432Carlito syrichta67.830.0 676
LLPS-Dio-2656Dipodomys ordii65.310.0 585
LLPS-Aim-2162Ailuropoda melanoleuca63.40.0 573
LLPS-Caf-0236Canis familiaris62.670.0 621
LLPS-Ran-1628Rattus norvegicus62.460.0 543
LLPS-Mum-4637Mus musculus62.164e-175 521
LLPS-Eqc-3916Equus caballus61.590.0 666
LLPS-Loa-2486Loxodonta africana60.00.0 579
LLPS-Mea-4260Mesocricetus auratus59.774e-177 526
LLPS-Bot-1363Bos taurus55.813e-176 523