FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE3764, 630 aa 1>>>pF1KE3764 630 - 630 aa - 630 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.3060+/-0.000911; mu= 7.2289+/- 0.055 mean_var=184.7405+/-37.904, 0's: 0 Z-trim(113.1): 56 B-trim: 0 in 0/51 Lambda= 0.094361 statistics sampled from 13702 (13756) to 13702 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.745), E-opt: 0.2 (0.423), width: 16 Scan time: 4.140 The best scores are: opt bits E(32554) CCDS10130.1 SHC4 gene_id:399694|Hs108|chr15 ( 630) 4298 597.5 1.8e-170 CCDS44233.1 SHC1 gene_id:6464|Hs108|chr1 ( 584) 1548 223.1 8.2e-58 CCDS30881.1 SHC1 gene_id:6464|Hs108|chr1 ( 583) 1540 222.0 1.7e-57 CCDS1076.1 SHC1 gene_id:6464|Hs108|chr1 ( 474) 1457 210.7 3.7e-54 CCDS44234.1 SHC1 gene_id:6464|Hs108|chr1 ( 473) 1449 209.6 7.9e-54 CCDS45891.1 SHC2 gene_id:25759|Hs108|chr19 ( 582) 1196 175.2 2.2e-43 CCDS6681.1 SHC3 gene_id:53358|Hs108|chr9 ( 594) 1002 148.8 2e-35 >>CCDS10130.1 SHC4 gene_id:399694|Hs108|chr15 (630 aa) initn: 4298 init1: 4298 opt: 4298 Z-score: 3174.2 bits: 597.5 E(32554): 1.8e-170 Smith-Waterman score: 4298; 100.0% identity (100.0% similar) in 630 aa overlap (1-630:1-630) 10 20 30 40 50 60 pF1KE3 MRERGQDSLAGLVLYVGLFGHPGMLHRAKYSRFRNESITSLDEGSSGGSVGNKGSPQPPH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MRERGQDSLAGLVLYVGLFGHPGMLHRAKYSRFRNESITSLDEGSSGGSVGNKGSPQPPH 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 PALAPHLPTEDATLPSQESPTPLCTLIPRMASMKLANPATLLSLKNFCLGTKEVPRLKLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 PALAPHLPTEDATLPSQESPTPLCTLIPRMASMKLANPATLLSLKNFCLGTKEVPRLKLQ 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 ESRDPGSSGPSSPETSLSRSGTAPPPQQDLVGHRATALTPDSCPLPGPGEPTLRSRQDRH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 ESRDPGSSGPSSPETSLSRSGTAPPPQQDLVGHRATALTPDSCPLPGPGEPTLRSRQDRH 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 FLQHLLGMGMNYCVRYMGCVEVLQSMRSLDFGMRTQVTREAISRLCEAVPGANGAIKKRK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 FLQHLLGMGMNYCVRYMGCVEVLQSMRSLDFGMRTQVTREAISRLCEAVPGANGAIKKRK 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 PPVKFLSTVLGKSNLQFSGMNIKLTISTCSLTLMNLDNQQIIANHHMQSISFASGGDPDT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 PPVKFLSTVLGKSNLQFSGMNIKLTISTCSLTLMNLDNQQIIANHHMQSISFASGGDPDT 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE3 TDYVAYVAKDPVNQRACHILECHNGMAQDVISTIGQAFELRFKQYLKNPSLNTSCESEEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 TDYVAYVAKDPVNQRACHILECHNGMAQDVISTIGQAFELRFKQYLKNPSLNTSCESEEV 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE3 HIDSHAEEREDHEYYNEIPGKQPPVGGVSDMRIKVQATEQMAYCPIQCEKLCYLPGNSKC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 HIDSHAEEREDHEYYNEIPGKQPPVGGVSDMRIKVQATEQMAYCPIQCEKLCYLPGNSKC 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE3 SSVYENCLEQSRAIGNVHPRGVQSQRDTSLLKHTCRVDLFDDPCYINTQALQSTPGSAGN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 SSVYENCLEQSRAIGNVHPRGVQSQRDTSLLKHTCRVDLFDDPCYINTQALQSTPGSAGN 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE3 QRSAQPLGSPWHCGKAPETVQPGATAQPASSHSLPHIKQQLWSEECYHGKLSRKAAESLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 QRSAQPLGSPWHCGKAPETVQPGATAQPASSHSLPHIKQQLWSEECYHGKLSRKAAESLL 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE3 VKDGDFLVRESATSPGQYVLSGLQGGQAKHLLLVDPEGKVRTKDHVFDNVGHLIRYHMDN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 VKDGDFLVRESATSPGQYVLSGLQGGQAKHLLLVDPEGKVRTKDHVFDNVGHLIRYHMDN 550 560 570 580 590 600 610 620 630 pF1KE3 SLPIISSGSEVSLKQPVRKDNNPALLHSNK :::::::::::::::::::::::::::::: CCDS10 SLPIISSGSEVSLKQPVRKDNNPALLHSNK 610 620 630 >>CCDS44233.1 SHC1 gene_id:6464|Hs108|chr1 (584 aa) initn: 1722 init1: 862 opt: 1548 Z-score: 1151.4 bits: 223.1 E(32554): 8.2e-58 Smith-Waterman score: 1638; 49.1% identity (69.9% similar) in 611 aa overlap (27-619:7-582) 10 20 30 40 50 60 pF1KE3 MRERGQDSLAGLVLYVGLFGHPGMLHRAKYSRFRNESITSLDEGSSGGSVGNKGSPQPPH . ::. .::::..::.::.:: :. . :.: CCDS44 MDLLPPKPKYNPLRNESLSSLEEGASG-STPPEELPSPSA 10 20 30 70 80 90 100 110 120 pF1KE3 PALAPHLPTEDATLPSQESPTPLCTLIPRMASMKLANPATLLSLKNFCLGTKEVPRLKLQ .:.: :: ::...::: ::...:::....::::: :.: : . CCDS44 SSLGPILP----PLPGDDSPTTLCSFFPRMSNLRLANPAGGRP------GSKGEPGRAAD 40 50 60 70 80 130 140 150 160 170 pF1KE3 ESRDPGSSGPSSPETSLSRSGTAPPPQQ--DLVGHRATALTPDSCPLPGPG---EPTLRS ... : : . :. :: : :. : : . .. : : . .. . CCDS44 DGE--GIVGAAMPD-----SGPLPLLQDMNKLSGGGGRRTRVEGGQLGGEEWTRHGSFVN 90 100 110 120 130 140 180 190 200 210 220 230 pF1KE3 RQDRHFLQ---HLLGMGMNYCVRYMGCVEVLQSMRSLDFGMRTQVTREAISRLCEAVPGA . : .:. ...: :..: ::::::::::::::.:::. :::::::::: .::::::: CCDS44 KPTRGWLHPNDKVMGPGVSYLVRYMGCVEVLQSMRALDFNTRTQVTREAISLVCEAVPGA 150 160 170 180 190 200 240 250 260 270 280 290 pF1KE3 NGAIKKRKPPVKFLSTVLGKSNLQFSGMNIKLTISTCSLTLMNLDNQQIIANHHMQSISF .:: ..::: . ::..::.:::.:.:: : ::.:: ::.:: : .::::::::::::: CCDS44 KGATRRRKPCSRPLSSILGRSNLKFAGMPITLTVSTSSLNLMAADCKQIIANHHMQSISF 210 220 230 240 250 260 300 310 320 330 340 350 pF1KE3 ASGGDPDTTDYVAYVAKDPVNQRACHILECHNGMAQDVISTIGQAFELRFKQYLKNPSLN ::::::::..:::::::::::::::::::: .:.::::::::::::::::::::.:: CCDS44 ASGGDPDTAEYVAYVAKDPVNQRACHILECPEGLAQDVISTIGQAFELRFKQYLRNPPKL 270 280 290 300 310 320 360 370 380 390 400 pF1KE3 TSCESEEVHIDSHA--EERE---DHEYYNEIPGKQPPVGGVSDMRIKVQATEQMAYCPIQ .. ... . .:. : ::.: ::.:::..:::.::.::: :::.. :. : : CCDS44 VTPHDRMAGFDGSAWDEEEEEPPDHQYYNDFPGKEPPLGGVVDMRLREGAAPGAAR-PTA 330 340 350 360 370 380 410 420 430 440 450 460 pF1KE3 CEKLCYLPGNSKCSSVYENCLEQSRAIGNVHPRGVQSQRDTSLLKHTCRVDLFDDPCYIN : :.. : : .. .:. :. :..: . : .::::: :.: CCDS44 -------P-NAQTPSHLGATLPVGQPVGG-DPE-VRKQMPPPPPCPAGR-ELFDDPSYVN 390 400 410 420 430 470 480 490 500 510 520 pF1KE3 TQALQSTPGSAGNQRSAQPLGSPWHCGKAPETV---QP--GATAQPASSHSLPHIKQQLW .: :... ..:. : : .: :.::. . .: : : .:. . .:: CCDS44 VQNLDKARQAVGG---AGP-PNPAINGSAPRDLFDMKPFEDALRVPPPPQSVS-MAEQLR 440 450 460 470 480 530 540 550 560 570 580 pF1KE3 SEECYHGKLSRKAAESLLVKDGDFLVRESATSPGQYVLSGLQGGQAKHLLLVDPEGKVRT .: .::::::. ::.:: .::::::::.:.::::::.:::.:: :::::::::: ::: CCDS44 GEPWFHGKLSRREAEALLQLNGDFLVRESTTTPGQYVLTGLQSGQPKHLLLVDPEGVVRT 490 500 510 520 530 540 590 600 610 620 630 pF1KE3 KDHVFDNVGHLIRYHMDNSLPIISSGSEVSLKQPVRKDNNPALLHSNK ::: :..:.::: ::::: :::::.:::. :.:::.. CCDS44 KDHRFESVSHLISYHMDNHLPIISAGSELCLQQPVERKL 550 560 570 580 >>CCDS30881.1 SHC1 gene_id:6464|Hs108|chr1 (583 aa) initn: 1590 init1: 862 opt: 1540 Z-score: 1145.5 bits: 222.0 E(32554): 1.7e-57 Smith-Waterman score: 1635; 49.0% identity (69.6% similar) in 612 aa overlap (27-619:7-581) 10 20 30 40 50 60 pF1KE3 MRERGQDSLAGLVLYVGLFGHPGMLHRAKYSRFRNESITSLDEGSSGGSVGNKGSPQPPH . ::. .::::..::.::.:: :. . :.: CCDS30 MDLLPPKPKYNPLRNESLSSLEEGASG-STPPEELPSPSA 10 20 30 70 80 90 100 110 120 pF1KE3 PALAPHLPTEDATLPSQESPTPLCTLIPRMASMKLANPATLLSLKNFCLGTKEVPRLKLQ .:.: :: ::...::: ::...:::....::::: :.: : . CCDS30 SSLGPILP----PLPGDDSPTTLCSFFPRMSNLRLANPAGGRP------GSKGEPGRAAD 40 50 60 70 80 130 140 150 160 170 pF1KE3 ESRDPGSSGPSSPETSLSRSGTAPPPQQ--DLVGHRATALTPDSCPLPGPG---EPTLRS ... : : . :. :: : :. : : . .. : : . .. . CCDS30 DGE--GIVGAAMPD-----SGPLPLLQDMNKLSGGGGRRTRVEGGQLGGEEWTRHGSFVN 90 100 110 120 130 140 180 190 200 210 220 230 pF1KE3 RQDRHFLQ---HLLGMGMNYCVRYMGCVEVLQSMRSLDFGMRTQVTREAISRLCEAVPGA . : .:. ...: :..: ::::::::::::::.:::. :::::::::: .::::::: CCDS30 KPTRGWLHPNDKVMGPGVSYLVRYMGCVEVLQSMRALDFNTRTQVTREAISLVCEAVPGA 150 160 170 180 190 200 240 250 260 270 280 290 pF1KE3 NGAIKKRKPPVKFLSTVLGKSNLQFSGMNIKLTISTCSLTLMNLDNQQIIANHHMQSISF .:: ..::: . ::..::.:::.:.:: : ::.:: ::.:: : .::::::::::::: CCDS30 KGATRRRKPCSRPLSSILGRSNLKFAGMPITLTVSTSSLNLMAADCKQIIANHHMQSISF 210 220 230 240 250 260 300 310 320 330 340 350 pF1KE3 ASGGDPDTTDYVAYVAKDPVNQRACHILECHNGMAQDVISTIGQAFELRFKQYLKNPSLN ::::::::..:::::::::::::::::::: .:.::::::::::::::::::::.:: CCDS30 ASGGDPDTAEYVAYVAKDPVNQRACHILECPEGLAQDVISTIGQAFELRFKQYLRNPPKL 270 280 290 300 310 320 360 370 380 390 400 pF1KE3 TSCESEEVHIDSHA--EERE---DHEYYNEIPGKQPPVGGVSDMRIKVQATEQMAYCPIQ .. ... . .:. : ::.: ::.:::..:::.::.::: :::.. :. : : CCDS30 VTPHDRMAGFDGSAWDEEEEEPPDHQYYNDFPGKEPPLGGVVDMRLREGAAPGAAR-PTA 330 340 350 360 370 380 410 420 430 440 450 460 pF1KE3 CEKLCYLPGNSKCSSVYENCLEQSRAIGNVHPRGVQSQRDTSLLKHTCR-VDLFDDPCYI : :.. : : .. .:. :. :..: : .::::: :. CCDS30 -------P-NAQTPSHLGATLPVGQPVGG-DPE-VRKQMPP---PPPCPGRELFDDPSYV 390 400 410 420 470 480 490 500 510 520 pF1KE3 NTQALQSTPGSAGNQRSAQPLGSPWHCGKAPETV---QP--GATAQPASSHSLPHIKQQL :.: :... ..:. : : .: :.::. . .: : : .:. . .:: CCDS30 NVQNLDKARQAVGG---AGP-PNPAINGSAPRDLFDMKPFEDALRVPPPPQSVS-MAEQL 430 440 450 460 470 480 530 540 550 560 570 580 pF1KE3 WSEECYHGKLSRKAAESLLVKDGDFLVRESATSPGQYVLSGLQGGQAKHLLLVDPEGKVR .: .::::::. ::.:: .::::::::.:.::::::.:::.:: :::::::::: :: CCDS30 RGEPWFHGKLSRREAEALLQLNGDFLVRESTTTPGQYVLTGLQSGQPKHLLLVDPEGVVR 490 500 510 520 530 540 590 600 610 620 630 pF1KE3 TKDHVFDNVGHLIRYHMDNSLPIISSGSEVSLKQPVRKDNNPALLHSNK :::: :..:.::: ::::: :::::.:::. :.:::.. CCDS30 TKDHRFESVSHLISYHMDNHLPIISAGSELCLQQPVERKL 550 560 570 580 >>CCDS1076.1 SHC1 gene_id:6464|Hs108|chr1 (474 aa) initn: 1512 init1: 862 opt: 1457 Z-score: 1085.7 bits: 210.7 E(32554): 3.7e-54 Smith-Waterman score: 1472; 55.8% identity (75.3% similar) in 450 aa overlap (180-619:40-472) 150 160 170 180 190 200 pF1KE3 LVGHRATALTPDSCPLPGPGEPTLRSRQDRHFLQHLLGMGMNYCVRYMGCVEVLQSMRSL : ....: :..: ::::::::::::::.: CCDS10 RRTRVEGGQLGGEEWTRHGSFVNKPTRGWLHPNDKVMGPGVSYLVRYMGCVEVLQSMRAL 10 20 30 40 50 60 210 220 230 240 250 260 pF1KE3 DFGMRTQVTREAISRLCEAVPGANGAIKKRKPPVKFLSTVLGKSNLQFSGMNIKLTISTC ::. :::::::::: .:::::::.:: ..::: . ::..::.:::.:.:: : ::.:: CCDS10 DFNTRTQVTREAISLVCEAVPGAKGATRRRKPCSRPLSSILGRSNLKFAGMPITLTVSTS 70 80 90 100 110 120 270 280 290 300 310 320 pF1KE3 SLTLMNLDNQQIIANHHMQSISFASGGDPDTTDYVAYVAKDPVNQRACHILECHNGMAQD ::.:: : .:::::::::::::::::::::..:::::::::::::::::::: .:.::: CCDS10 SLNLMAADCKQIIANHHMQSISFASGGDPDTAEYVAYVAKDPVNQRACHILECPEGLAQD 130 140 150 160 170 180 330 340 350 360 370 380 pF1KE3 VISTIGQAFELRFKQYLKNPSLNTSCESEEVHIDSHA--EERE---DHEYYNEIPGKQPP :::::::::::::::::.:: .. ... . .:. : ::.: ::.:::..:::.:: CCDS10 VISTIGQAFELRFKQYLRNPPKLVTPHDRMAGFDGSAWDEEEEEPPDHQYYNDFPGKEPP 190 200 210 220 230 240 390 400 410 420 430 440 pF1KE3 VGGVSDMRIKVQATEQMAYCPIQCEKLCYLPGNSKCSSVYENCLEQSRAIGNVHPRGVQS .::: :::.. :. : : : :.. : : .. .:. :. :.. CCDS10 LGGVVDMRLREGAAPGAAR-PTA-------P-NAQTPSHLGATLPVGQPVGG-DPE-VRK 250 260 270 280 290 450 460 470 480 490 500 pF1KE3 QRDTSLLKHTCRVDLFDDPCYINTQALQSTPGSAGNQRSAQPLGSPWHCGKAPETV---Q : . : .::::: :.:.: :... ..:. : : .: :.::. . . CCDS10 QMPPPPPCPAGR-ELFDDPSYVNVQNLDKARQAVGG---AGP-PNPAINGSAPRDLFDMK 300 310 320 330 340 350 510 520 530 540 550 pF1KE3 P--GATAQPASSHSLPHIKQQLWSEECYHGKLSRKAAESLLVKDGDFLVRESATSPGQYV : : : .:. . .:: .: .::::::. ::.:: .::::::::.:.::::: CCDS10 PFEDALRVPPPPQSVS-MAEQLRGEPWFHGKLSRREAEALLQLNGDFLVRESTTTPGQYV 360 370 380 390 400 410 560 570 580 590 600 610 pF1KE3 LSGLQGGQAKHLLLVDPEGKVRTKDHVFDNVGHLIRYHMDNSLPIISSGSEVSLKQPVRK :.:::.:: :::::::::: :::::: :..:.::: ::::: :::::.:::. :.:::.. CCDS10 LTGLQSGQPKHLLLVDPEGVVRTKDHRFESVSHLISYHMDNHLPIISAGSELCLQQPVER 420 430 440 450 460 470 620 630 pF1KE3 DNNPALLHSNK CCDS10 KL >>CCDS44234.1 SHC1 gene_id:6464|Hs108|chr1 (473 aa) initn: 1380 init1: 862 opt: 1449 Z-score: 1079.8 bits: 209.6 E(32554): 7.9e-54 Smith-Waterman score: 1469; 55.7% identity (74.9% similar) in 451 aa overlap (180-619:40-471) 150 160 170 180 190 200 pF1KE3 LVGHRATALTPDSCPLPGPGEPTLRSRQDRHFLQHLLGMGMNYCVRYMGCVEVLQSMRSL : ....: :..: ::::::::::::::.: CCDS44 RRTRVEGGQLGGEEWTRHGSFVNKPTRGWLHPNDKVMGPGVSYLVRYMGCVEVLQSMRAL 10 20 30 40 50 60 210 220 230 240 250 260 pF1KE3 DFGMRTQVTREAISRLCEAVPGANGAIKKRKPPVKFLSTVLGKSNLQFSGMNIKLTISTC ::. :::::::::: .:::::::.:: ..::: . ::..::.:::.:.:: : ::.:: CCDS44 DFNTRTQVTREAISLVCEAVPGAKGATRRRKPCSRPLSSILGRSNLKFAGMPITLTVSTS 70 80 90 100 110 120 270 280 290 300 310 320 pF1KE3 SLTLMNLDNQQIIANHHMQSISFASGGDPDTTDYVAYVAKDPVNQRACHILECHNGMAQD ::.:: : .:::::::::::::::::::::..:::::::::::::::::::: .:.::: CCDS44 SLNLMAADCKQIIANHHMQSISFASGGDPDTAEYVAYVAKDPVNQRACHILECPEGLAQD 130 140 150 160 170 180 330 340 350 360 370 380 pF1KE3 VISTIGQAFELRFKQYLKNPSLNTSCESEEVHIDSHA--EERE---DHEYYNEIPGKQPP :::::::::::::::::.:: .. ... . .:. : ::.: ::.:::..:::.:: CCDS44 VISTIGQAFELRFKQYLRNPPKLVTPHDRMAGFDGSAWDEEEEEPPDHQYYNDFPGKEPP 190 200 210 220 230 240 390 400 410 420 430 440 pF1KE3 VGGVSDMRIKVQATEQMAYCPIQCEKLCYLPGNSKCSSVYENCLEQSRAIGNVHPRGVQS .::: :::.. :. : : : :.. : : .. .:. :. :.. CCDS44 LGGVVDMRLREGAAPGAAR-PTA-------P-NAQTPSHLGATLPVGQPVGG-DPE-VRK 250 260 270 280 290 450 460 470 480 490 500 pF1KE3 QRDTSLLKHTCR-VDLFDDPCYINTQALQSTPGSAGNQRSAQPLGSPWHCGKAPETV--- : : .::::: :.:.: :... ..:. : : .: :.::. . CCDS44 QMPPP---PPCPGRELFDDPSYVNVQNLDKARQAVGG---AGP-PNPAINGSAPRDLFDM 300 310 320 330 340 350 510 520 530 540 550 pF1KE3 QP--GATAQPASSHSLPHIKQQLWSEECYHGKLSRKAAESLLVKDGDFLVRESATSPGQY .: : : .:. . .:: .: .::::::. ::.:: .::::::::.:.:::: CCDS44 KPFEDALRVPPPPQSVS-MAEQLRGEPWFHGKLSRREAEALLQLNGDFLVRESTTTPGQY 360 370 380 390 400 410 560 570 580 590 600 610 pF1KE3 VLSGLQGGQAKHLLLVDPEGKVRTKDHVFDNVGHLIRYHMDNSLPIISSGSEVSLKQPVR ::.:::.:: :::::::::: :::::: :..:.::: ::::: :::::.:::. :.:::. CCDS44 VLTGLQSGQPKHLLLVDPEGVVRTKDHRFESVSHLISYHMDNHLPIISAGSELCLQQPVE 420 430 440 450 460 470 620 630 pF1KE3 KDNNPALLHSNK . CCDS44 RKL >>CCDS45891.1 SHC2 gene_id:25759|Hs108|chr19 (582 aa) initn: 1139 init1: 523 opt: 1196 Z-score: 892.4 bits: 175.2 E(32554): 2.2e-43 Smith-Waterman score: 1279; 41.1% identity (61.2% similar) in 618 aa overlap (51-620:6-581) 30 40 50 60 70 80 pF1KE3 HPGMLHRAKYSRFRNESITSLDEGSSGGSVGNKGSPQPPHPALAPHLPTEDATLPSQESP :... : :: : : :.: CCDS45 MTQGPGGRAPPAPPAP-------------PEPEAP 10 20 90 100 110 120 130 140 pF1KE3 TPLCTLIPRMASMKLANPATLLSLKNFCLGTKEVPRLKLQESRDPGSSGPSSPETSLSRS : .:.:.::: . :.: :. .:. . : .: :.:: ..:. . CCDS45 TTFCALLPRMPQWKFAAPGGFLG---------RGP----AAARAAGASGGADPQPEPAGP 30 40 50 60 150 160 170 pF1KE3 GTAPPPQQDLVGH-RATALTPDSCPLP--------------------GPGEPTLRSRQDR : .: ..: . .: :::: : :. . .. : CCDS45 GGVPALAAAVLGACEPRCAAP--CPLPALSRCRGAGSRGSRGGRGAAGSGDAAAAAEWIR 70 80 90 100 110 120 180 190 200 210 220 pF1KE3 ---------HFLQH----LLGMGMNYCVRYMGCVEVLQSMRSLDFGMRTQVTREAISRLC : : .:: :..: ::::::.:::.:::::::. :::::::::.:: CCDS45 KGSFIHKPAHGWLHPDARVLGPGVSYVVRYMGCIEVLRSMRSLDFNTRTQVTREAINRLH 130 140 150 160 170 180 230 240 250 260 270 280 pF1KE3 EAVPGANGAIKKRKPPVKFLSTVLGKSNLQFSGMNIKLTISTCSLTLMNLDNQQIIANHH :::::. :. :: : : : :..:::::::.:.::.:.. ::: .:.: ..:.::::: CCDS45 EAVPGVRGSWKK-KAPNKALASVLGKSNLRFAGMSISIHISTDGLSLSVPATRQVIANHH 190 200 210 220 230 240 290 300 310 320 330 340 pF1KE3 MQSISFASGGDPDTTDYVAYVAKDPVNQRACHILECHNGMAQDVISTIGQAFELRFKQYL : ::::::::: : :::::::::::.:::::::::: .:.::..:::.:::::::::::: CCDS45 MPSISFASGGDTDMTDYVAYVAKDPINQRACHILECCEGLAQSIISTVGQAFELRFKQYL 250 260 270 280 290 300 350 360 370 380 390 pF1KE3 KNP-SLNTSCESEEVHIDSHAEERED---HEYYNEIPGKQPPVGGVSDMRIKVQ---ATE ..: .. : .: ..:: :.::: ::::.::.::. : :. . : CCDS45 HSPPKVALPPERLAGPEESAWGDEEDSLEHNYYNSIPGKEPPLGGLVDSRLALTQPCALT 310 320 330 340 350 360 400 410 420 430 440 450 pF1KE3 QMAYCPIQCEK-LCYLPGN--SKCSSVYENCLEQSRAIGNV-HPRG--VQSQR-DTSLLK . : . : :: . : .. . :. : : : . :..: :. . CCDS45 ALDQGPSPSLRDACSLPWDVGSTGTAPPGDGYVQADARGPPDHEEHLYVNTQGLDAPEPE 370 380 390 400 410 420 460 470 480 490 500 510 pF1KE3 HTCRVDLFDDPCYINTQALQSTPGSAGNQRSAQPLGSPWHCGKAPETVQPGATAQPASSH . . :::: . .. :. .:: . :: . : .: : . : . :. . CCDS45 DSPKKDLFDMRPFEDALKLHECSVAAGVTAAPLPLEDQW---PSPPTRR--APVAPTEEQ 430 440 450 460 470 480 520 530 540 550 560 570 pF1KE3 SLPHIKQQLWSEECYHGKLSRKAAESLLVKDGDFLVRESATSPGQYVLSGLQGGQAKHLL ..:. : :::..::.::: .: :::::::.:.:.::::::.:...:: :::: CCDS45 ----LRQEPW----YHGRMSRRAAERMLRADGDFLVRDSVTNPGQYVLTGMHAGQPKHLL 490 500 510 520 530 580 590 600 610 620 630 pF1KE3 LVDPEGKVRTKDHVFDNVGHLIRYHMDNSLPIISSGSEVSLKQPVRKDNNPALLHSNK :::::: ::::: .:....::: .:..:. ::... ::. :. : .. CCDS45 LVDPEGVVRTKDVLFESISHLIDHHLQNGQPIVAAESELHLRGVVSREP 540 550 560 570 580 >>CCDS6681.1 SHC3 gene_id:53358|Hs108|chr9 (594 aa) initn: 1502 init1: 884 opt: 1002 Z-score: 749.6 bits: 148.8 E(32554): 2e-35 Smith-Waterman score: 1530; 44.2% identity (67.6% similar) in 633 aa overlap (24-619:1-592) 10 20 30 40 50 pF1KE3 MRERGQDSLAGLVLYVGLFGHPGMLHRAKYSRFRNESITSLDE-----GSSGGSVGNKGS :: :.::.::::.:.::.:. . ::: :.: : CCDS66 MLPRTKYNRFRNDSVTSVDDLLHSLSVSGG--GGKVS 10 20 30 60 70 80 90 100 110 pF1KE3 PQPPHPALAPHLPTEDATLPS-QESPTPLCTLIPRMASMKLANPATLLSLKNFCLGTKEV :: ::.: . .: . ...: : :. ... .::.. . :... ...: CCDS66 AARATPAAAPYLVSGEALRKAPDDGPGSLGHLLHKVSHLKLSSSG----LRGLSSAARER 40 50 60 70 80 90 120 130 140 150 160 170 pF1KE3 PRLKLQESRDPGSSGPSSPETSLSRSGTAPPPQQDLVGHRATALTPDSCPLPGPGEPTLR .: :: : . . .:.:: . . : : . ::: : : CCDS66 AGARL--------SGSCSAPSLAAPDGSAPSAPRAPAMSAARKGRPGDEPLPRP--P--- 100 110 120 130 180 190 200 210 220 230 pF1KE3 SRQDRHFLQHLLGMGMNYCVRYMGCVEVLQSMRSLDFGMRTQVTREAISRLCEAVPGANG : : ...:: :..: :.:.::.:::.:::::::. :::.:::::::.:::::::.: CCDS66 -RGAPHASDQVLGPGVTYVVKYLGCIEVLRSMRSLDFSTRTQITREAISRVCEAVPGAKG 140 150 160 170 180 190 240 250 260 270 280 290 pF1KE3 AIKKRKPPVKFLSTVLGKSNLQFSGMNIKLTISTCSLTLMNLDNQQIIANHHMQSISFAS :.:::::: :.::..::::::::.::.:.::::: ::.: . :..::::::::.:::::: CCDS66 AFKKRKPPSKMLSSILGKSNLQFAGMSISLTISTASLNLRTPDSKQIIANHHMRSISFAS 200 210 220 230 240 250 300 310 320 330 340 350 pF1KE3 GGDPDTTDYVAYVAKDPVNQRACHILECHNGMAQDVISTIGQAFELRFKQYLKNPSLNTS :::::::::::::::::::.:::::::: .:.:::::..:::::::::::::. :. . CCDS66 GGDPDTTDYVAYVAKDPVNRRACHILECCDGLAQDVIGSIGQAFELRFKQYLQCPTKIPA 260 270 280 290 300 310 360 370 380 390 400 410 pF1KE3 CESEEVHIDSHAEERE----DHEYYNEIPGKQPPVGGVSDMRIKVQATEQMAYCPIQCEK ... .: :.: :: ::: ::.:.:: :: : :.: . : CCDS66 LHDRMQSLDEPWTEEEGDGSDHPYYNSIPSKMPPPGGFLDTRLKPR--------P----- 320 330 340 350 360 420 430 440 450 460 pF1KE3 LCYLPGNSKCSSVYENCLEQSRAIGNVHPRGVQS---QRDTSLLKHTCRVDLF-----DD . : ... .. :. :.: .:.. . :. .. .: . : . : . CCDS66 --HAPDTAQFAG-KEQTYYQGRHLGDTFGEDWQQTPLRQGSSDIYSTPEGKLHVAPTGEA 370 380 390 400 410 420 470 480 490 500 pF1KE3 PCYINTQAL--QSTPGSAGNQRSA-----------------QPLGSPWHCGKAPETVQPG : :.::: . :. :..... .:. :::: . . : ..: CCDS66 PTYVNTQQIPPQAWPAAVSSAESSPRKDLFDMKPFEDALKNQPLGPVLSKAASVECISPV 430 440 450 460 470 480 510 520 530 540 550 560 pF1KE3 ATAQPASSHSLPHIKQQLWSEECYHGKLSRKAAESLLVKDGDFLVRESATSPGQYVLSGL . : ... : ... . : :.:..::: ::.:: ::::::::.:.:.::..::.:. CCDS66 SPRAP-DAKMLEELQAETW----YQGEMSRKEAEGLLEKDGDFLVRKSTTNPGSFVLTGM 490 500 510 520 530 570 580 590 600 610 620 pF1KE3 QGGQAKHLLLVDPEGKVRTKDHVFDNVGHLIRYHMDNSLPIISSGSEVSLKQPVRKDNNP ..::::::::::::: .::::.:::...::: .:...::::.:.:::. :.:::.. CCDS66 HNGQAKHLLLVDPEGTIRTKDRVFDSISHLINHHLESSLPIVSAGSELCLQQPVERKQ 540 550 560 570 580 590 630 pF1KE3 ALLHSNK 630 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 07:07:55 2016 done: Sun Nov 6 07:07:55 2016 Total Scan time: 4.140 Total Display time: 0.090 Function used was FASTA [36.3.4 Apr, 2011]