• Disorder
  • Domain
  • PTM
  • Variation
  • Mutation
  • Interaction
  • Disease
  • Drug
  • Physicochemical
  • Function
  • Proteomics
  • Structure
  • Localization
  • Expression
  • Element
  • Methylation

LLPS-Man-4016
SOS1

Integrated Annotations

▼ OVERVIEW


Status: Unreviewed
Protein Name: Uncharacterized protein
Gene Name: SOS1
Ensembl Gene: ENSMNEG00000044082.1
Ensembl Protein: ENSMNEP00000042754.1
Organism: Macaca nemestrina
Taxa ID: 9545
LLPS Type: Scaffold


▼ PROPERTY



▼ Classification


Condensates:
CondensateEvidenceOrthologs
Droplet, Receptor clusterPredicted from orthologs(View)

▼ CROSS REFERENCE


▼ SEQUENCE


Protein Sequence (FASTA)
1     MQAQQLPYEF  FSEENAPKWR  GLLVPALKKV  QGQVHPTLES  NDDALQYVEE  LILQLLNMLC  60
61    QAQPRSASDV  EERVQKSFPH  PIDKWAIADA  QSAIEKRKRR  NPLSLPVEKI  HPLLKEVLGY  120
121   KIDHQVSVYI  VAVLEYISAD  ILKLVGNYVR  NIRHYEITKQ  DIKVAMCADK  VLMDMFHQDV  180
181   EDINILSLTD  EEPSTSGEQT  YYDLVKAFMA  EIRQYIRELN  LIIKVFREPF  VSNSKLFSAN  240
241   DVENIFSRIV  DIHELSVKLL  GHIEDTVEMT  DEGSPHPLVG  SCFEDLAEEL  AFDPYESYAR  300
301   DILRPGFHDR  FLSQLSKPGA  ALYLQSIGEG  FKEAVQYVLP  RLLLAPVYHC  LHYFELLKQL  360
361   EEKSEDQEDK  ECLKQAITAL  LNVQSGMEKI  CSKSLAKRRL  SESACRFYSQ  QMKGKQLAIK  420
421   KMNEIQKNID  GWEGKDIGQC  CNEFIMEGTL  TRVGAKHERH  IFLFDGLMIC  CKSNHGQPRL  480
481   PGASNAEYRL  KEKFFMRKVQ  INDKDDTNEY  KHAFEIILKD  ENSVIFSAKS  AEEKNNWMAA  540
541   LISLQYRSTL  ERMLDVTMLQ  EEKEEQMRLP  SADVYRFAEP  DSEENIIFEE  NMQPKAGIPI  600
601   IKAGTVIKLI  ERLTYHMYAD  PNFVRTFLTT  YRSFCKPQEL  LSLIIERFEI  PEPEPTEADR  660
661   IAIENGDQPL  SAELKRFRKE  YIQPVQLRVL  NVCRHWVEHH  FYDFERDAYL  LQRMEEFIGT  720
721   VRGKAMKKWV  ESITKIIQRK  KIARDNGPGH  NITFQSSPPT  VEWHISRPGH  IETFDLLTLH  780
781   PIEIARQLTL  LESDLYRAVQ  PSELVGSVWT  KEDKEINSPN  LLKMIRHTTN  LTLWFEKCIV  840
841   ETENLEERVA  VVSRIIEILQ  VFQELNNFNG  VLEVVSAMNS  SPVYRLDHTF  EVRKKLAFSF  900
901   FILEIIPLYL  LGIYLTNILK  TEEGNPEVLK  RHGKELINFS  KRRKVAEITG  EIQQYQNQPY  960
961   CLRVESDIKR  FFENLNPMGN  SMEKEFTDYL  FNKSLEIEPR  NPKPLPRFPK  KYSYPLKSPG  1020
1021  VRPSNPRPGT  MRHPTPLQQE  PRKISYSRIP  ESETESTASA  PNSPRTPLTP  PPASGASSTT  1080
1081  DVCSVFDSDH  SSPFHSSNDT  VFIQVTLPHG  PRSASVSSIS  LTKGTDEVPV  PPPVPPRRRP  1140
1141  ESAPAESSPS  KIMSKHLDSP  PAIPPRQPTS  KAYSPRYSIS  DRTSISDPPE  SPPLLPPREP  1200
1201  VRTPDVFSSS  PLHLQPPPLG  KKSDHGNAFF  PNSPSPFTPP  PPQTPSPHGT  RRHLPSPPLT  1260
1261  QEVDLHSIAG  PPVPPRQSTS  QHIPKLPPKT  YKREHTHPSM  HRDGPPLLEN  AHSS  1314
Nucleotide CDS Sequence (FASTA)
1     ATGCAGGCGC  AGCAGCTGCC  ATACGAGTTT  TTCAGCGAAG  AGAACGCGCC  CAAGTGGCGG  60
61    GGACTGCTGG  TGCCTGCGCT  GAAAAAGGTC  CAGGGGCAAG  TTCATCCTAC  TCTCGAGTCT  120
121   AATGATGATG  CTCTTCAGTA  TGTTGAAGAA  TTAATTTTGC  AATTATTAAA  TATGCTATGT  180
181   CAAGCTCAGC  CCCGAAGTGC  TTCAGATGTA  GAGGAACGTG  TTCAAAAAAG  TTTCCCTCAT  240
241   CCAATTGATA  AGTGGGCAAT  AGCTGATGCC  CAATCAGCTA  TTGAAAAGAG  GAAGCGAAGA  300
301   AACCCTTTAT  CCCTCCCAGT  AGAAAAAATC  CATCCTTTAT  TAAAGGAGGT  CCTAGGTTAT  360
361   AAAATTGACC  ATCAGGTTTC  TGTTTACATA  GTAGCAGTCT  TAGAATACAT  TTCTGCAGAC  420
421   ATTTTAAAGC  TGGTTGGGAA  TTATGTAAGA  AATATACGGC  ATTATGAAAT  TACAAAACAA  480
481   GATATTAAAG  TGGCAATGTG  TGCTGACAAG  GTATTGATGG  ATATGTTTCA  TCAAGATGTA  540
541   GAAGATATTA  ATATATTATC  TTTAACTGAT  GAAGAGCCTT  CCACCTCAGG  AGAACAAACT  600
601   TACTATGATT  TGGTAAAAGC  ATTTATGGCA  GAAATTCGAC  AATATATAAG  GGAACTAAAT  660
661   CTAATTATAA  AAGTTTTTAG  AGAGCCCTTT  GTCTCCAATT  CAAAATTGTT  TTCAGCTAAT  720
721   GATGTAGAAA  ATATATTTAG  TCGTATAGTA  GATATACATG  AACTTAGTGT  AAAGTTACTG  780
781   GGCCATATAG  AAGATACAGT  AGAAATGACA  GATGAAGGCA  GTCCCCATCC  ACTAGTAGGA  840
841   AGCTGCTTTG  AAGACTTAGC  AGAGGAACTG  GCATTTGATC  CATATGAATC  GTATGCTCGA  900
901   GATATTTTGC  GACCTGGTTT  TCATGATCGT  TTCCTTAGTC  AGTTATCAAA  GCCTGGGGCA  960
961   GCACTTTATT  TGCAGTCAAT  AGGCGAAGGT  TTCAAAGAAG  CTGTTCAATA  TGTTTTACCC  1020
1021  AGGCTGCTTC  TGGCCCCTGT  TTACCACTGT  CTCCATTACT  TTGAACTTTT  GAAGCAGTTA  1080
1081  GAAGAAAAAA  GTGAAGATCA  AGAAGACAAG  GAATGTTTAA  AACAAGCAAT  AACAGCTTTG  1140
1141  CTTAATGTTC  AGAGTGGTAT  GGAAAAAATA  TGTTCTAAAA  GTCTTGCAAA  ACGAAGACTG  1200
1201  AGTGAATCTG  CATGTCGGTT  TTATAGTCAA  CAAATGAAGG  GGAAACAACT  AGCAATCAAG  1260
1261  AAAATGAATG  AGATTCAGAA  GAATATTGAT  GGTTGGGAGG  GAAAAGACAT  TGGACAGTGT  1320
1321  TGCAATGAAT  TTATAATGGA  AGGAACTCTT  ACACGTGTAG  GAGCCAAACA  TGAGAGACAC  1380
1381  ATATTTCTCT  TTGATGGCTT  AATGATTTGC  TGTAAATCAA  ATCATGGGCA  GCCAAGACTT  1440
1441  CCTGGTGCTA  GCAATGCAGA  ATATCGTCTT  AAAGAAAAGT  TTTTTATGCG  AAAGGTACAA  1500
1501  ATTAATGATA  AAGATGACAC  CAATGAATAC  AAGCATGCTT  TTGAAATAAT  TTTAAAAGAT  1560
1561  GAAAATAGTG  TTATATTTTC  TGCCAAGTCA  GCTGAAGAGA  AAAACAATTG  GATGGCAGCA  1620
1621  TTGATATCTT  TACAGTACCG  GAGTACACTG  GAAAGGATGC  TTGATGTAAC  AATGCTACAG  1680
1681  GAAGAGAAAG  AGGAGCAGAT  GAGGCTGCCT  AGTGCTGATG  TTTATAGATT  TGCGGAGCCT  1740
1741  GACTCTGAAG  AGAATATTAT  ATTTGAAGAG  AACATGCAGC  CCAAGGCTGG  AATTCCAATT  1800
1801  ATCAAAGCAG  GAACTGTTAT  TAAACTTATA  GAGAGGCTTA  CGTACCATAT  GTACGCAGAT  1860
1861  CCCAATTTTG  TTCGGACATT  TCTTACAACA  TACAGATCCT  TTTGCAAACC  TCAAGAACTA  1920
1921  CTGAGTCTTA  TAATAGAAAG  GTTTGAAATT  CCAGAGCCTG  AGCCAACAGA  AGCTGATCGC  1980
1981  ATAGCTATAG  AGAATGGAGA  TCAACCCTTG  AGTGCAGAAC  TGAAAAGATT  TAGAAAAGAA  2040
2041  TATATACAGC  CTGTGCAACT  GCGAGTATTA  AATGTATGTC  GGCACTGGGT  AGAGCACCAC  2100
2101  TTCTATGATT  TTGAAAGAGA  TGCATATCTT  TTGCAACGAA  TGGAAGAATT  TATTGGAACA  2160
2161  GTAAGAGGTA  AAGCAATGAA  AAAATGGGTT  GAATCCATCA  CTAAAATAAT  CCAAAGGAAA  2220
2221  AAAATTGCAA  GAGACAATGG  ACCAGGTCAT  AATATTACAT  TTCAGAGTTC  ACCTCCCACA  2280
2281  GTTGAGTGGC  ATATAAGCAG  ACCTGGGCAC  ATAGAGACTT  TCGACCTGCT  CACCTTACAC  2340
2341  CCAATAGAAA  TTGCTCGACA  ACTCACTTTA  CTTGAATCAG  ATCTATACCG  AGCTGTACAG  2400
2401  CCATCAGAAT  TAGTTGGAAG  TGTGTGGACA  AAAGAAGACA  AAGAAATTAA  CTCTCCTAAT  2460
2461  CTTCTGAAAA  TGATTCGACA  TACCACCAAC  CTTACTCTGT  GGTTTGAGAA  ATGTATTGTA  2520
2521  GAAACTGAAA  ATTTAGAAGA  AAGAGTAGCT  GTGGTGAGTC  GAATAATTGA  GATTCTACAA  2580
2581  GTCTTTCAAG  AGTTGAACAA  CTTTAATGGT  GTCCTTGAGG  TTGTCAGTGC  TATGAATTCC  2640
2641  TCACCTGTTT  ACAGACTAGA  CCACACATTT  GAGGTAAGAA  AAAAACTTGC  ATTTTCCTTC  2700
2701  TTTATCCTTG  AAATCATTCC  TTTATATCTT  CTAGGAATTT  ATCTCACTAA  TATCTTGAAA  2760
2761  ACAGAAGAAG  GCAACCCTGA  GGTCCTAAAA  AGACATGGAA  AAGAGCTTAT  AAACTTTAGC  2820
2821  AAAAGGAGGA  AAGTAGCAGA  AATAACAGGA  GAGATCCAGC  AGTACCAAAA  TCAGCCTTAC  2880
2881  TGTTTACGAG  TAGAATCAGA  TATCAAAAGA  TTCTTTGAAA  ACTTGAATCC  GATGGGAAAC  2940
2941  AGCATGGAAA  AAGAATTTAC  AGATTATCTT  TTCAACAAAT  CCCTAGAAAT  AGAACCACGA  3000
3001  AACCCTAAGC  CTCTCCCAAG  ATTTCCAAAA  AAATATAGCT  ATCCCCTAAA  ATCTCCTGGT  3060
3061  GTTCGTCCAT  CAAACCCAAG  ACCAGGTACC  ATGAGGCATC  CCACACCTCT  GCAGCAGGAG  3120
3121  CCAAGGAAAA  TTAGTTATAG  TAGGATCCCT  GAAAGTGAAA  CAGAAAGTAC  AGCATCTGCA  3180
3181  CCAAATTCTC  CAAGAACACC  GTTAACACCT  CCGCCTGCTT  CTGGTGCTTC  CAGTACCACA  3240
3241  GATGTTTGCA  GTGTATTTGA  TTCCGATCAT  TCGAGCCCTT  TTCACTCAAG  CAATGATACC  3300
3301  GTCTTTATCC  AAGTTACACT  GCCCCATGGC  CCAAGATCTG  CTTCTGTATC  ATCTATAAGT  3360
3361  TTAACCAAAG  GCACTGATGA  AGTGCCTGTC  CCTCCTCCTG  TTCCTCCACG  AAGACGACCA  3420
3421  GAATCTGCCC  CAGCAGAATC  TTCACCATCT  AAGATTATGT  CTAAGCATTT  GGACAGCCCC  3480
3481  CCAGCCATTC  CTCCTAGGCA  ACCCACATCA  AAAGCCTATT  CACCACGATA  TTCAATATCA  3540
3541  GACCGGACCT  CTATCTCAGA  CCCTCCTGAA  AGCCCTCCCT  TATTACCACC  ACGAGAACCT  3600
3601  GTGAGGACAC  CTGATGTTTT  CTCAAGCTCA  CCACTACATC  TCCAACCTCC  CCCTTTGGGC  3660
3661  AAAAAAAGTG  ACCATGGCAA  TGCCTTCTTC  CCAAACAGCC  CATCCCCCTT  TACACCACCT  3720
3721  CCTCCTCAAA  CACCTTCTCC  TCACGGCACA  AGAAGGCATC  TGCCATCACC  ACCATTGACA  3780
3781  CAAGAAGTGG  ACCTTCATTC  CATTGCTGGG  CCGCCTGTTC  CTCCACGACA  AAGCACTTCT  3840
3841  CAACATATCC  CTAAACTCCC  TCCAAAAACT  TATAAAAGGG  AGCACACACA  CCCATCCATG  3900
3901  CACAGAGATG  GACCACCACT  GTTGGAGAAT  GCCCATTCTT  CTTGA  3945

▼ ORTHOLOGY


DrLLPS IDOrganismIdentityE-valueScore
LLPS-Hos-2341Homo sapiens97.150.02386
LLPS-Cea-3950Cercocebus atys97.150.02386
LLPS-Chs-3399Chlorocebus sabaeus97.150.02386
LLPS-Gog-1273Gorilla gorilla97.150.02386
LLPS-Maf-4352Macaca fascicularis97.080.02311
LLPS-Mal-4619Mandrillus leucophaeus97.080.02315
LLPS-Pat-4783Pan troglodytes97.00.02383
LLPS-Paa-1478Papio anubis96.940.02323
LLPS-Caj-1471Callithrix jacchus96.930.02379
LLPS-Aon-3186Aotus nancymaae96.850.02377
LLPS-Mup-2841Mustela putorius furo96.560.02255
LLPS-Eqc-1272Equus caballus96.550.02369
LLPS-Bot-1563Bos taurus96.480.02366
LLPS-Fec-3874Felis catus96.40.02364
LLPS-Nol-3211Nomascus leucogenys96.40.02378
LLPS-Aim-2892Ailuropoda melanoleuca96.40.02362
LLPS-Urm-2815Ursus maritimus96.320.02253
LLPS-Otg-3011Otolemur garnettii96.250.02303
LLPS-Ova-2062Ovis aries96.250.02302
LLPS-Myl-1777Myotis lucifugus96.250.02305
LLPS-Sus-0981Sus scrofa96.180.02306
LLPS-Caf-3748Canis familiaris96.110.02310
LLPS-Ict-0995Ictidomys tridecemlineatus95.880.02372
LLPS-Pap-0820Pan paniscus95.060.02326
LLPS-Fud-3021Fukomys damarensis94.410.02253
LLPS-Mam-4434Macaca mulatta94.160.02283
LLPS-Dio-2902Dipodomys ordii93.810.02244
LLPS-Loa-3803Loxodonta africana93.790.02286
LLPS-Poa-1728Pongo abelii93.780.02273
LLPS-Mum-3126Mus musculus93.630.02274
LLPS-Mea-4467Mesocricetus auratus93.420.02283
LLPS-Ran-4454Rattus norvegicus92.970.02275
LLPS-Rhb-2161Rhinopithecus bieti92.870.02241
LLPS-Cap-3124Cavia porcellus92.580.02206
LLPS-Mod-0315Monodelphis domestica92.350.02200
LLPS-Sah-3375Sarcophilus harrisii91.610.02267
LLPS-Ora-3320Ornithorhynchus anatinus91.530.02043
LLPS-Anp-2397Anas platyrhynchos88.330.02065
LLPS-Pes-1877Pelodiscus sinensis88.150.02083
LLPS-Gaga-2106Gallus gallus88.030.02152
LLPS-Tag-3399Taeniopygia guttata87.140.02112
LLPS-Fia-1479Ficedula albicollis86.440.02031
LLPS-Xet-1887Xenopus tropicalis86.210.02073
LLPS-Meg-0717Meleagris gallopavo86.20.02088
LLPS-Anc-2353Anolis carolinensis85.640.02072
LLPS-Lac-2135Latimeria chalumnae83.480.02056
LLPS-Scf-3180Scleropages formosus82.310.01978
LLPS-Leo-1922Lepisosteus oculatus82.060.01999
LLPS-Asm-1346Astyanax mexicanus81.160.01948
LLPS-Orn-3806Oreochromis niloticus79.670.01768
LLPS-Icp-2684Ictalurus punctatus78.880.01919
LLPS-Orl-3025Oryzias latipes78.350.01690
LLPS-Scm-3102Scophthalmus maximus77.920.01721
LLPS-Ten-2890Tetraodon nigroviridis77.060.01744
LLPS-Gaa-3772Gasterosteus aculeatus76.00.01729
LLPS-Xim-0179Xiphophorus maculatus72.310.01603
LLPS-Tar-2387Takifugu rubripes70.720.01680
LLPS-Pof-3419Poecilia formosa69.850.01635
LLPS-Cii-1364Ciona intestinalis48.620.0 632
LLPS-Cis-1711Ciona savignyi47.812e-95 317
LLPS-Cae-1792Caenorhabditis elegans31.824e-157 518
LLPS-Abg-1546Absidia glauca30.91e-48 194
LLPS-Dar-1776Danio rerio30.168e-23 110
LLPS-Mel-1234Melampsora laricipopulina29.914e-44 174
LLPS-Cas-3949Carlito syrichta29.661e-0863.9
LLPS-Drm-2211Drosophila melanogaster29.444e-1895.1
LLPS-Pytr-1321Pyrenophora triticirepentis28.083e-42 173
LLPS-Ast-1255Aspergillus terreus27.533e-30 130
LLPS-Lem-0425Leptosphaeria maculans26.972e-27 125
LLPS-Blg-0225Blumeria graminis25.697e-28 127
LLPS-Pug-1028Puccinia graminis25.338e-28 126
LLPS-Phn-1165Phaeosphaeria nodorum25.179e-23 110
LLPS-Scc-1518Schizosaccharomyces cryophilus24.943e-26 121
LLPS-Fuv-0807Fusarium verticillioides24.523e-25 118
LLPS-Crn-0074Cryptococcus neoformans24.361e-20 103
LLPS-Asni-0271Aspergillus niger24.217e-29 127
LLPS-Scj-0622Schizosaccharomyces japonicus22.991e-1793.6