FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE1510, 715 aa 1>>>pF1KE1510 715 - 715 aa - 715 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.4870+/-0.00104; mu= 18.6358+/- 0.063 mean_var=67.9488+/-13.266, 0's: 0 Z-trim(103.3): 21 B-trim: 0 in 0/50 Lambda= 0.155591 statistics sampled from 7332 (7352) to 7332 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.6), E-opt: 0.2 (0.226), width: 16 Scan time: 2.120 The best scores are: opt bits E(32554) CCDS47545.1 SCIN gene_id:85477|Hs108|chr7 ( 715) 4802 1087.6 0 CCDS47546.1 SCIN gene_id:85477|Hs108|chr7 ( 468) 3150 716.7 2e-206 CCDS6829.1 GSN gene_id:2934|Hs108|chr9 ( 731) 3085 702.2 7.2e-202 CCDS65118.1 GSN gene_id:2934|Hs108|chr9 ( 739) 3085 702.2 7.3e-202 CCDS48011.1 GSN gene_id:2934|Hs108|chr9 ( 742) 3085 702.2 7.3e-202 CCDS75891.1 GSN gene_id:2934|Hs108|chr9 ( 748) 3085 702.2 7.4e-202 CCDS75890.1 GSN gene_id:2934|Hs108|chr9 ( 767) 3085 702.2 7.5e-202 CCDS6828.1 GSN gene_id:2934|Hs108|chr9 ( 782) 3085 702.2 7.7e-202 CCDS8959.1 AVIL gene_id:10677|Hs108|chr12 ( 819) 2324 531.4 2.1e-150 CCDS2417.1 VIL1 gene_id:7429|Hs108|chr2 ( 827) 2293 524.4 2.6e-148 CCDS2670.2 VILL gene_id:50853|Hs108|chr3 ( 856) 1768 406.6 8.1e-113 CCDS1974.1 CAPG gene_id:822|Hs108|chr2 ( 348) 1176 273.5 3.8e-73 CCDS58522.1 FLII gene_id:2314|Hs108|chr17 (1214) 516 125.6 4.4e-28 CCDS58521.1 FLII gene_id:2314|Hs108|chr17 (1258) 516 125.6 4.5e-28 CCDS11192.1 FLII gene_id:2314|Hs108|chr17 (1269) 516 125.6 4.5e-28 CCDS58715.1 CAPG gene_id:822|Hs108|chr2 ( 333) 506 123.1 6.9e-28 >>CCDS47545.1 SCIN gene_id:85477|Hs108|chr7 (715 aa) initn: 4802 init1: 4802 opt: 4802 Z-score: 5820.7 bits: 1087.6 E(32554): 0 Smith-Waterman score: 4802; 99.9% identity (100.0% similar) in 715 aa overlap (1-715:1-715) 10 20 30 40 50 60 pF1KE1 MARELYHEEFARAGKQAGLQVWRIEKLELVPVPQSAHGDFYVGDAYLVLHTAKTSRGFTY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 MARELYHEEFARAGKQAGLQVWRIEKLELVPVPQSAHGDFYVGDAYLVLHTAKTSRGFTY 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 RLHFWLGKECSQDESTAAAIFTVQMDDYLGGKPVQNRELQGYESNDFVSYFKGGLKYKAG .::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 HLHFWLGKECSQDESTAAAIFTVQMDDYLGGKPVQNRELQGYESNDFVSYFKGGLKYKAG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 GVASGLNHVLTNDLTAKRLLHVKGRRVVRATEVPLSWDSFNKGDCFIIDLGTEIYQWCGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 GVASGLNHVLTNDLTAKRLLHVKGRRVVRATEVPLSWDSFNKGDCFIIDLGTEIYQWCGS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 SCNKYERLKANQVATGIRYNERKGRSELIVVEEGSEPSELIKVLGEKPELPDGGDDDDII :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 SCNKYERLKANQVATGIRYNERKGRSELIVVEEGSEPSELIKVLGEKPELPDGGDDDDII 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE1 ADISNRKMAKLYMVSDASGSMRVTVVAEENPFSMAMLLSEECFILDHGAAKQIFVWKGKD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 ADISNRKMAKLYMVSDASGSMRVTVVAEENPFSMAMLLSEECFILDHGAAKQIFVWKGKD 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE1 ANPQERKAAMKTAEEFLQQMNYSKNTQIQVLPEGGETPIFKQFFKDWRDKDQSDGFGKVY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 ANPQERKAAMKTAEEFLQQMNYSKNTQIQVLPEGGETPIFKQFFKDWRDKDQSDGFGKVY 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE1 VTEKVAQIKQIPFDASKLHSSPQMAAQHNMVDDGSGKVEIWRVENNGRIQVDQNSYGEFY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 VTEKVAQIKQIPFDASKLHSSPQMAAQHNMVDDGSGKVEIWRVENNGRIQVDQNSYGEFY 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE1 GGDCYIILYTYPRGQIIYTWQGANATRDELTTSAFLTVQLDRSLGGQAVQIRVSQGKEPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 GGDCYIILYTYPRGQIIYTWQGANATRDELTTSAFLTVQLDRSLGGQAVQIRVSQGKEPV 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE1 HLLSLFKDKPLIIYKNGTSKKGGQAPAPPTRLFQVRRNLASITRIVEVDVDANSLNSNDV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 HLLSLFKDKPLIIYKNGTSKKGGQAPAPPTRLFQVRRNLASITRIVEVDVDANSLNSNDV 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE1 FVLKLPQNSGYIWVGKGASQEEEKGAEYVASVLKCKTLRIQEGEEPEEFWNSLGGKKDYQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 FVLKLPQNSGYIWVGKGASQEEEKGAEYVASVLKCKTLRIQEGEEPEEFWNSLGGKKDYQ 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE1 TSPLLETQAEDHPPRLYGCSNKTGRFVIEEIPGEFTQDDLAEDDVMLLDAWEQIFIWIGK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 TSPLLETQAEDHPPRLYGCSNKTGRFVIEEIPGEFTQDDLAEDDVMLLDAWEQIFIWIGK 610 620 630 640 650 660 670 680 690 700 710 pF1KE1 DANEVEKKESLKSAKMYLETDPSGRDKRTPIVIIKQGHEPPTFTGWFLGWDSSKW ::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 DANEVEKKESLKSAKMYLETDPSGRDKRTPIVIIKQGHEPPTFTGWFLGWDSSKW 670 680 690 700 710 >>CCDS47546.1 SCIN gene_id:85477|Hs108|chr7 (468 aa) initn: 3150 init1: 3150 opt: 3150 Z-score: 3819.4 bits: 716.7 E(32554): 2e-206 Smith-Waterman score: 3150; 100.0% identity (100.0% similar) in 468 aa overlap (248-715:1-468) 220 230 240 250 260 270 pF1KE1 SELIKVLGEKPELPDGGDDDDIIADISNRKMAKLYMVSDASGSMRVTVVAEENPFSMAML :::::::::::::::::::::::::::::: CCDS47 MAKLYMVSDASGSMRVTVVAEENPFSMAML 10 20 30 280 290 300 310 320 330 pF1KE1 LSEECFILDHGAAKQIFVWKGKDANPQERKAAMKTAEEFLQQMNYSKNTQIQVLPEGGET :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 LSEECFILDHGAAKQIFVWKGKDANPQERKAAMKTAEEFLQQMNYSKNTQIQVLPEGGET 40 50 60 70 80 90 340 350 360 370 380 390 pF1KE1 PIFKQFFKDWRDKDQSDGFGKVYVTEKVAQIKQIPFDASKLHSSPQMAAQHNMVDDGSGK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 PIFKQFFKDWRDKDQSDGFGKVYVTEKVAQIKQIPFDASKLHSSPQMAAQHNMVDDGSGK 100 110 120 130 140 150 400 410 420 430 440 450 pF1KE1 VEIWRVENNGRIQVDQNSYGEFYGGDCYIILYTYPRGQIIYTWQGANATRDELTTSAFLT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 VEIWRVENNGRIQVDQNSYGEFYGGDCYIILYTYPRGQIIYTWQGANATRDELTTSAFLT 160 170 180 190 200 210 460 470 480 490 500 510 pF1KE1 VQLDRSLGGQAVQIRVSQGKEPVHLLSLFKDKPLIIYKNGTSKKGGQAPAPPTRLFQVRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 VQLDRSLGGQAVQIRVSQGKEPVHLLSLFKDKPLIIYKNGTSKKGGQAPAPPTRLFQVRR 220 230 240 250 260 270 520 530 540 550 560 570 pF1KE1 NLASITRIVEVDVDANSLNSNDVFVLKLPQNSGYIWVGKGASQEEEKGAEYVASVLKCKT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 NLASITRIVEVDVDANSLNSNDVFVLKLPQNSGYIWVGKGASQEEEKGAEYVASVLKCKT 280 290 300 310 320 330 580 590 600 610 620 630 pF1KE1 LRIQEGEEPEEFWNSLGGKKDYQTSPLLETQAEDHPPRLYGCSNKTGRFVIEEIPGEFTQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 LRIQEGEEPEEFWNSLGGKKDYQTSPLLETQAEDHPPRLYGCSNKTGRFVIEEIPGEFTQ 340 350 360 370 380 390 640 650 660 670 680 690 pF1KE1 DDLAEDDVMLLDAWEQIFIWIGKDANEVEKKESLKSAKMYLETDPSGRDKRTPIVIIKQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 DDLAEDDVMLLDAWEQIFIWIGKDANEVEKKESLKSAKMYLETDPSGRDKRTPIVIIKQG 400 410 420 430 440 450 700 710 pF1KE1 HEPPTFTGWFLGWDSSKW :::::::::::::::::: CCDS47 HEPPTFTGWFLGWDSSKW 460 >>CCDS6829.1 GSN gene_id:2934|Hs108|chr9 (731 aa) initn: 2072 init1: 994 opt: 3085 Z-score: 3737.6 bits: 702.2 E(32554): 7.2e-202 Smith-Waterman score: 3085; 60.3% identity (84.8% similar) in 715 aa overlap (7-715:5-717) 10 20 30 40 50 pF1KE1 MARELYHEEFARAGKQAGLQVWRIEKLELVPVPQSAHGDFYVGDAYLVLHTAKTSRG-FT : :: .:::. :::.::.::..::::: . .:::..::::..:.:.. : . CCDS68 MVVEHPEFLKAGKEPGLQIWRVEKFDLVPVPTNLYGDFFTGDAYVILKTVQLRNGNLQ 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 YRLHFWLGKECSQDESTAAAIFTVQMDDYLGGKPVQNRELQGYESNDFVSYFKGGLKYKA : ::.:::.::::::: ::::::::.::::.:. ::.::.::.:: :..:::.::::: CCDS68 YDLHYWLGNECSQDESGAAAIFTVQLDDYLNGRAVQHREVQGFESATFLGYFKSGLKYKK 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE1 GGVASGLNHVLTNDLTAKRLLHVKGRRVVRATEVPLSWDSFNKGDCFIIDLGTEIYQWCG ::::::..::. :.....::..:::::::::::::.::.:::.:::::.:::..:.:::: CCDS68 GGVASGFKHVVPNEVVVQRLFQVKGRRVVRATEVPVSWESFNNGDCFILDLGNNIHQWCG 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE1 SSCNKYERLKANQVATGIRYNERKGRSELIVVEEGSEPSELIKVLGEKPELPDGGDDDDI :. :.::::::.::. ::: :::.::... : :::.:: ...::: :: :: .: .: CCDS68 SNSNRYERLKATQVSKGIRDNERSGRARVHVSEEGTEPEAMLQVLGPKPALP-AGTEDTA 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE1 IADISNRKMAKLYMVSDASGSMRVTVVAEENPFSMAMLLSEECFILDHGAAKQIFVWKGK : .:::.:::: ::...:.: :..::.::::... : ::.::::::: .::::::: CCDS68 KEDAANRKLAKLYKVSNGAGTMSVSLVADENPFAQGALKSEDCFILDHGKDGKIFVWKGK 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE1 DANPQERKAAMKTAEEFLQQMNYSKNTQIQVLPEGGETPIFKQFFKDWRDKDQSDGFGKV .:: .:::::.::: .:. .:.: :.::..:::::::::.::::::.::: ::.::.: CCDS68 QANTEERKAALKTASDFITKMDYPKQTQVSVLPEGGETPLFKQFFKNWRDPDQTDGLGLS 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE1 YVTEKVAQIKQIPFDASKLHSSPQMAAQHNMVDDGSGKVEIWRVENNGRIQVDQNSYGEF :.. ..:.....::::. ::.: :::::.: :::.:. .:::.:..... :: .::.: CCDS68 YLSSHIANVERVPFDAATLHTSTAMAAQHGMDDDGTGQKQIWRIEGSNKVPVDPATYGQF 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE1 YGGDCYIILYTYP----RGQIIYTWQGANATRDELTTSAFLTVQLDRSLGGQAVQIRVSQ :::: :::::.: .:::::.::::..:.::...::.::.:::. ::: :: :: : CCDS68 YGGDSYIILYNYRHGGRQGQIIYNWQGAQSTQDEVAASAILTAQLDEELGGTPVQSRVVQ 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE1 GKEPVHLLSLFKDKPLIIYKNGTSKKGGQAPAPPTRLFQVRRNLASITRIVEVDVDANSL ::::.::.::: ::.::::.:::..:::. ::::::: : :. :: ::: :..: CCDS68 GKEPAHLMSLFGGKPMIIYKGGTSREGGQTAPASTRLFQVRANSAGATRAVEVLPKAGAL 480 490 500 510 520 530 540 550 560 570 580 590 pF1KE1 NSNDVFVLKLPQNSGYIWVGKGASQEEEKGAEYVASVLKCKTLRIQEGEEPEEFWNSLGG ::::.:::: : ...:.::: :::. :. ::. . ::. . ... :: ::. ::..::: CCDS68 NSNDAFVLKTP-SAAYLWVGTGASEAEKTGAQELLRVLRAQPVQVAEGSEPDGFWEALGG 540 550 560 570 580 590 600 610 620 630 640 650 pF1KE1 KKDYQTSPLLETQAED-HPPRLYGCSNKTGRFVIEEIPGEFTQDDLAEDDVMLLDAWEQI : :.::: :. . : :::::..:::: :::::::.:::. :.::: :::::::.:.:. CCDS68 KAAYRTSPRLKDKKMDAHPPRLFACSNKIGRFVIEEVPGELMQEDLATDDVMLLDTWDQV 600 610 620 630 640 650 660 670 680 690 700 710 pF1KE1 FIWIGKDANEVEKKESLKSAKMYLETDPSGRDKRTPIVIIKQGHEPPTFTGWFLGWDSSK :.:.:::..: :: :.: ::: :.::::..::.::::...::: :::.:.:::::::.. CCDS68 FVWVGKDSQEEEKTEALTSAKRYIETDPANRDRRTPITVVKQGFEPPSFVGWFLGWDDDY 660 670 680 690 700 710 pF1KE1 W : CCDS68 WSVDPLDRAMAELAA 720 730 >>CCDS65118.1 GSN gene_id:2934|Hs108|chr9 (739 aa) initn: 2072 init1: 994 opt: 3085 Z-score: 3737.5 bits: 702.2 E(32554): 7.3e-202 Smith-Waterman score: 3085; 60.3% identity (84.8% similar) in 715 aa overlap (7-715:13-725) 10 20 30 40 50 pF1KE1 MARELYHEEFARAGKQAGLQVWRIEKLELVPVPQSAHGDFYVGDAYLVLHTAKT : :: .:::. :::.::.::..::::: . .:::..::::..:.:.. CCDS65 MPLCTPNSMVVEHPEFLKAGKEPGLQIWRVEKFDLVPVPTNLYGDFFTGDAYVILKTVQL 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE1 SRG-FTYRLHFWLGKECSQDESTAAAIFTVQMDDYLGGKPVQNRELQGYESNDFVSYFKG : . : ::.:::.::::::: ::::::::.::::.:. ::.::.::.:: :..:::. CCDS65 RNGNLQYDLHYWLGNECSQDESGAAAIFTVQLDDYLNGRAVQHREVQGFESATFLGYFKS 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE1 GLKYKAGGVASGLNHVLTNDLTAKRLLHVKGRRVVRATEVPLSWDSFNKGDCFIIDLGTE ::::: ::::::..::. :.....::..:::::::::::::.::.:::.:::::.:::.. CCDS65 GLKYKKGGVASGFKHVVPNEVVVQRLFQVKGRRVVRATEVPVSWESFNNGDCFILDLGNN 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE1 IYQWCGSSCNKYERLKANQVATGIRYNERKGRSELIVVEEGSEPSELIKVLGEKPELPDG :.:::::. :.::::::.::. ::: :::.::... : :::.:: ...::: :: :: . CCDS65 IHQWCGSNSNRYERLKATQVSKGIRDNERSGRARVHVSEEGTEPEAMLQVLGPKPALP-A 190 200 210 220 230 240 250 260 270 280 290 pF1KE1 GDDDDIIADISNRKMAKLYMVSDASGSMRVTVVAEENPFSMAMLLSEECFILDHGAAKQI : .: : .:::.:::: ::...:.: :..::.::::... : ::.::::::: .: CCDS65 GTEDTAKEDAANRKLAKLYKVSNGAGTMSVSLVADENPFAQGALKSEDCFILDHGKDGKI 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE1 FVWKGKDANPQERKAAMKTAEEFLQQMNYSKNTQIQVLPEGGETPIFKQFFKDWRDKDQS ::::::.:: .:::::.::: .:. .:.: :.::..:::::::::.::::::.::: ::. CCDS65 FVWKGKQANTEERKAALKTASDFITKMDYPKQTQVSVLPEGGETPLFKQFFKNWRDPDQT 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE1 DGFGKVYVTEKVAQIKQIPFDASKLHSSPQMAAQHNMVDDGSGKVEIWRVENNGRIQVDQ ::.: :.. ..:.....::::. ::.: :::::.: :::.:. .:::.:..... :: CCDS65 DGLGLSYLSSHIANVERVPFDAATLHTSTAMAAQHGMDDDGTGQKQIWRIEGSNKVPVDP 360 370 380 390 400 410 420 430 440 450 460 pF1KE1 NSYGEFYGGDCYIILYTYP----RGQIIYTWQGANATRDELTTSAFLTVQLDRSLGGQAV .::.::::: :::::.: .:::::.::::..:.::...::.::.:::. ::: : CCDS65 ATYGQFYGGDSYIILYNYRHGGRQGQIIYNWQGAQSTQDEVAASAILTAQLDEELGGTPV 420 430 440 450 460 470 470 480 490 500 510 520 pF1KE1 QIRVSQGKEPVHLLSLFKDKPLIIYKNGTSKKGGQAPAPPTRLFQVRRNLASITRIVEVD : :: :::::.::.::: ::.::::.:::..:::. ::::::: : :. :: ::: CCDS65 QSRVVQGKEPAHLMSLFGGKPMIIYKGGTSREGGQTAPASTRLFQVRANSAGATRAVEVL 480 490 500 510 520 530 530 540 550 560 570 580 pF1KE1 VDANSLNSNDVFVLKLPQNSGYIWVGKGASQEEEKGAEYVASVLKCKTLRIQEGEEPEEF :..:::::.:::: : ...:.::: :::. :. ::. . ::. . ... :: ::. : CCDS65 PKAGALNSNDAFVLKTP-SAAYLWVGTGASEAEKTGAQELLRVLRAQPVQVAEGSEPDGF 540 550 560 570 580 590 590 600 610 620 630 640 pF1KE1 WNSLGGKKDYQTSPLLETQAED-HPPRLYGCSNKTGRFVIEEIPGEFTQDDLAEDDVMLL :..:::: :.::: :. . : :::::..:::: :::::::.:::. :.::: :::::: CCDS65 WEALGGKAAYRTSPRLKDKKMDAHPPRLFACSNKIGRFVIEEVPGELMQEDLATDDVMLL 600 610 620 630 640 650 650 660 670 680 690 700 pF1KE1 DAWEQIFIWIGKDANEVEKKESLKSAKMYLETDPSGRDKRTPIVIIKQGHEPPTFTGWFL :.:.:.:.:.:::..: :: :.: ::: :.::::..::.::::...::: :::.:.:::: CCDS65 DTWDQVFVWVGKDSQEEEKTEALTSAKRYIETDPANRDRRTPITVVKQGFEPPSFVGWFL 660 670 680 690 700 710 710 pF1KE1 GWDSSKW :::.. : CCDS65 GWDDDYWSVDPLDRAMAELAA 720 730 >>CCDS48011.1 GSN gene_id:2934|Hs108|chr9 (742 aa) initn: 2072 init1: 994 opt: 3085 Z-score: 3737.5 bits: 702.2 E(32554): 7.3e-202 Smith-Waterman score: 3085; 60.3% identity (84.8% similar) in 715 aa overlap (7-715:16-728) 10 20 30 40 50 pF1KE1 MARELYHEEFARAGKQAGLQVWRIEKLELVPVPQSAHGDFYVGDAYLVLHT : :: .:::. :::.::.::..::::: . .:::..::::..:.: CCDS48 MEKLFCCFPNSMVVEHPEFLKAGKEPGLQIWRVEKFDLVPVPTNLYGDFFTGDAYVILKT 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE1 AKTSRG-FTYRLHFWLGKECSQDESTAAAIFTVQMDDYLGGKPVQNRELQGYESNDFVSY .. : . : ::.:::.::::::: ::::::::.::::.:. ::.::.::.:: :..: CCDS48 VQLRNGNLQYDLHYWLGNECSQDESGAAAIFTVQLDDYLNGRAVQHREVQGFESATFLGY 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE1 FKGGLKYKAGGVASGLNHVLTNDLTAKRLLHVKGRRVVRATEVPLSWDSFNKGDCFIIDL ::.::::: ::::::..::. :.....::..:::::::::::::.::.:::.:::::.:: CCDS48 FKSGLKYKKGGVASGFKHVVPNEVVVQRLFQVKGRRVVRATEVPVSWESFNNGDCFILDL 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE1 GTEIYQWCGSSCNKYERLKANQVATGIRYNERKGRSELIVVEEGSEPSELIKVLGEKPEL :..:.:::::. :.::::::.::. ::: :::.::... : :::.:: ...::: :: : CCDS48 GNNIHQWCGSNSNRYERLKATQVSKGIRDNERSGRARVHVSEEGTEPEAMLQVLGPKPAL 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE1 PDGGDDDDIIADISNRKMAKLYMVSDASGSMRVTVVAEENPFSMAMLLSEECFILDHGAA : .: .: : .:::.:::: ::...:.: :..::.::::... : ::.::::::: CCDS48 P-AGTEDTAKEDAANRKLAKLYKVSNGAGTMSVSLVADENPFAQGALKSEDCFILDHGKD 250 260 270 280 290 300 310 320 330 340 350 pF1KE1 KQIFVWKGKDANPQERKAAMKTAEEFLQQMNYSKNTQIQVLPEGGETPIFKQFFKDWRDK .:::::::.:: .:::::.::: .:. .:.: :.::..:::::::::.::::::.::: CCDS48 GKIFVWKGKQANTEERKAALKTASDFITKMDYPKQTQVSVLPEGGETPLFKQFFKNWRDP 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE1 DQSDGFGKVYVTEKVAQIKQIPFDASKLHSSPQMAAQHNMVDDGSGKVEIWRVENNGRIQ ::.::.: :.. ..:.....::::. ::.: :::::.: :::.:. .:::.:..... CCDS48 DQTDGLGLSYLSSHIANVERVPFDAATLHTSTAMAAQHGMDDDGTGQKQIWRIEGSNKVP 360 370 380 390 400 410 420 430 440 450 460 pF1KE1 VDQNSYGEFYGGDCYIILYTYP----RGQIIYTWQGANATRDELTTSAFLTVQLDRSLGG :: .::.::::: :::::.: .:::::.::::..:.::...::.::.:::. ::: CCDS48 VDPATYGQFYGGDSYIILYNYRHGGRQGQIIYNWQGAQSTQDEVAASAILTAQLDEELGG 420 430 440 450 460 470 470 480 490 500 510 520 pF1KE1 QAVQIRVSQGKEPVHLLSLFKDKPLIIYKNGTSKKGGQAPAPPTRLFQVRRNLASITRIV :: :: :::::.::.::: ::.::::.:::..:::. ::::::: : :. :: : CCDS48 TPVQSRVVQGKEPAHLMSLFGGKPMIIYKGGTSREGGQTAPASTRLFQVRANSAGATRAV 480 490 500 510 520 530 530 540 550 560 570 580 pF1KE1 EVDVDANSLNSNDVFVLKLPQNSGYIWVGKGASQEEEKGAEYVASVLKCKTLRIQEGEEP :: :..:::::.:::: : ...:.::: :::. :. ::. . ::. . ... :: :: CCDS48 EVLPKAGALNSNDAFVLKTP-SAAYLWVGTGASEAEKTGAQELLRVLRAQPVQVAEGSEP 540 550 560 570 580 590 590 600 610 620 630 640 pF1KE1 EEFWNSLGGKKDYQTSPLLETQAED-HPPRLYGCSNKTGRFVIEEIPGEFTQDDLAEDDV . ::..:::: :.::: :. . : :::::..:::: :::::::.:::. :.::: ::: CCDS48 DGFWEALGGKAAYRTSPRLKDKKMDAHPPRLFACSNKIGRFVIEEVPGELMQEDLATDDV 600 610 620 630 640 650 650 660 670 680 690 700 pF1KE1 MLLDAWEQIFIWIGKDANEVEKKESLKSAKMYLETDPSGRDKRTPIVIIKQGHEPPTFTG ::::.:.:.:.:.:::..: :: :.: ::: :.::::..::.::::...::: :::.:.: CCDS48 MLLDTWDQVFVWVGKDSQEEEKTEALTSAKRYIETDPANRDRRTPITVVKQGFEPPSFVG 660 670 680 690 700 710 710 pF1KE1 WFLGWDSSKW ::::::.. : CCDS48 WFLGWDDDYWSVDPLDRAMAELAA 720 730 740 >>CCDS75891.1 GSN gene_id:2934|Hs108|chr9 (748 aa) initn: 2072 init1: 994 opt: 3085 Z-score: 3737.5 bits: 702.2 E(32554): 7.4e-202 Smith-Waterman score: 3085; 60.3% identity (84.8% similar) in 715 aa overlap (7-715:22-734) 10 20 30 40 pF1KE1 MARELYHEEFARAGKQAGLQVWRIEKLELVPVPQSAHGDFYVGDA : :: .:::. :::.::.::..::::: . .:::..::: CCDS75 MAEEEALRGNSDPWPNSMVVEHPEFLKAGKEPGLQIWRVEKFDLVPVPTNLYGDFFTGDA 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE1 YLVLHTAKTSRG-FTYRLHFWLGKECSQDESTAAAIFTVQMDDYLGGKPVQNRELQGYES :..:.:.. : . : ::.:::.::::::: ::::::::.::::.:. ::.::.::.:: CCDS75 YVILKTVQLRNGNLQYDLHYWLGNECSQDESGAAAIFTVQLDDYLNGRAVQHREVQGFES 70 80 90 100 110 120 110 120 130 140 150 160 pF1KE1 NDFVSYFKGGLKYKAGGVASGLNHVLTNDLTAKRLLHVKGRRVVRATEVPLSWDSFNKGD :..:::.::::: ::::::..::. :.....::..:::::::::::::.::.:::.:: CCDS75 ATFLGYFKSGLKYKKGGVASGFKHVVPNEVVVQRLFQVKGRRVVRATEVPVSWESFNNGD 130 140 150 160 170 180 170 180 190 200 210 220 pF1KE1 CFIIDLGTEIYQWCGSSCNKYERLKANQVATGIRYNERKGRSELIVVEEGSEPSELIKVL :::.:::..:.:::::. :.::::::.::. ::: :::.::... : :::.:: ...:: CCDS75 CFILDLGNNIHQWCGSNSNRYERLKATQVSKGIRDNERSGRARVHVSEEGTEPEAMLQVL 190 200 210 220 230 240 230 240 250 260 270 280 pF1KE1 GEKPELPDGGDDDDIIADISNRKMAKLYMVSDASGSMRVTVVAEENPFSMAMLLSEECFI : :: :: .: .: : .:::.:::: ::...:.: :..::.::::... : ::.::: CCDS75 GPKPALP-AGTEDTAKEDAANRKLAKLYKVSNGAGTMSVSLVADENPFAQGALKSEDCFI 250 260 270 280 290 290 300 310 320 330 340 pF1KE1 LDHGAAKQIFVWKGKDANPQERKAAMKTAEEFLQQMNYSKNTQIQVLPEGGETPIFKQFF :::: .:::::::.:: .:::::.::: .:. .:.: :.::..:::::::::.::::: CCDS75 LDHGKDGKIFVWKGKQANTEERKAALKTASDFITKMDYPKQTQVSVLPEGGETPLFKQFF 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE1 KDWRDKDQSDGFGKVYVTEKVAQIKQIPFDASKLHSSPQMAAQHNMVDDGSGKVEIWRVE :.::: ::.::.: :.. ..:.....::::. ::.: :::::.: :::.:. .:::.: CCDS75 KNWRDPDQTDGLGLSYLSSHIANVERVPFDAATLHTSTAMAAQHGMDDDGTGQKQIWRIE 360 370 380 390 400 410 410 420 430 440 450 460 pF1KE1 NNGRIQVDQNSYGEFYGGDCYIILYTYP----RGQIIYTWQGANATRDELTTSAFLTVQL ..... :: .::.::::: :::::.: .:::::.::::..:.::...::.::.:: CCDS75 GSNKVPVDPATYGQFYGGDSYIILYNYRHGGRQGQIIYNWQGAQSTQDEVAASAILTAQL 420 430 440 450 460 470 470 480 490 500 510 520 pF1KE1 DRSLGGQAVQIRVSQGKEPVHLLSLFKDKPLIIYKNGTSKKGGQAPAPPTRLFQVRRNLA :. ::: :: :: :::::.::.::: ::.::::.:::..:::. ::::::: : : CCDS75 DEELGGTPVQSRVVQGKEPAHLMSLFGGKPMIIYKGGTSREGGQTAPASTRLFQVRANSA 480 490 500 510 520 530 530 540 550 560 570 580 pF1KE1 SITRIVEVDVDANSLNSNDVFVLKLPQNSGYIWVGKGASQEEEKGAEYVASVLKCKTLRI . :: ::: :..:::::.:::: : ...:.::: :::. :. ::. . ::. . ... CCDS75 GATRAVEVLPKAGALNSNDAFVLKTP-SAAYLWVGTGASEAEKTGAQELLRVLRAQPVQV 540 550 560 570 580 590 590 600 610 620 630 pF1KE1 QEGEEPEEFWNSLGGKKDYQTSPLLETQAED-HPPRLYGCSNKTGRFVIEEIPGEFTQDD :: ::. ::..:::: :.::: :. . : :::::..:::: :::::::.:::. :.: CCDS75 AEGSEPDGFWEALGGKAAYRTSPRLKDKKMDAHPPRLFACSNKIGRFVIEEVPGELMQED 600 610 620 630 640 650 640 650 660 670 680 690 pF1KE1 LAEDDVMLLDAWEQIFIWIGKDANEVEKKESLKSAKMYLETDPSGRDKRTPIVIIKQGHE :: :::::::.:.:.:.:.:::..: :: :.: ::: :.::::..::.::::...::: : CCDS75 LATDDVMLLDTWDQVFVWVGKDSQEEEKTEALTSAKRYIETDPANRDRRTPITVVKQGFE 660 670 680 690 700 710 700 710 pF1KE1 PPTFTGWFLGWDSSKW ::.:.:::::::.. : CCDS75 PPSFVGWFLGWDDDYWSVDPLDRAMAELAA 720 730 740 >>CCDS75890.1 GSN gene_id:2934|Hs108|chr9 (767 aa) initn: 2072 init1: 994 opt: 3085 Z-score: 3737.3 bits: 702.2 E(32554): 7.5e-202 Smith-Waterman score: 3085; 60.3% identity (84.8% similar) in 715 aa overlap (7-715:41-753) 10 20 30 pF1KE1 MARELYHEEFARAGKQAGLQVWRIEKLELVPVPQSA : :: .:::. :::.::.::..::::: . CCDS75 PSWLPDGDMSHPQPELFLFPKAQPNSMVVEHPEFLKAGKEPGLQIWRVEKFDLVPVPTNL 20 30 40 50 60 70 40 50 60 70 80 90 pF1KE1 HGDFYVGDAYLVLHTAKTSRG-FTYRLHFWLGKECSQDESTAAAIFTVQMDDYLGGKPVQ .:::..::::..:.:.. : . : ::.:::.::::::: ::::::::.::::.:. :: CCDS75 YGDFFTGDAYVILKTVQLRNGNLQYDLHYWLGNECSQDESGAAAIFTVQLDDYLNGRAVQ 80 90 100 110 120 130 100 110 120 130 140 150 pF1KE1 NRELQGYESNDFVSYFKGGLKYKAGGVASGLNHVLTNDLTAKRLLHVKGRRVVRATEVPL .::.::.:: :..:::.::::: ::::::..::. :.....::..:::::::::::::. CCDS75 HREVQGFESATFLGYFKSGLKYKKGGVASGFKHVVPNEVVVQRLFQVKGRRVVRATEVPV 140 150 160 170 180 190 160 170 180 190 200 210 pF1KE1 SWDSFNKGDCFIIDLGTEIYQWCGSSCNKYERLKANQVATGIRYNERKGRSELIVVEEGS ::.:::.:::::.:::..:.:::::. :.::::::.::. ::: :::.::... : :::. CCDS75 SWESFNNGDCFILDLGNNIHQWCGSNSNRYERLKATQVSKGIRDNERSGRARVHVSEEGT 200 210 220 230 240 250 220 230 240 250 260 270 pF1KE1 EPSELIKVLGEKPELPDGGDDDDIIADISNRKMAKLYMVSDASGSMRVTVVAEENPFSMA :: ...::: :: :: .: .: : .:::.:::: ::...:.: :..::.::::... CCDS75 EPEAMLQVLGPKPALP-AGTEDTAKEDAANRKLAKLYKVSNGAGTMSVSLVADENPFAQG 260 270 280 290 300 280 290 300 310 320 330 pF1KE1 MLLSEECFILDHGAAKQIFVWKGKDANPQERKAAMKTAEEFLQQMNYSKNTQIQVLPEGG : ::.::::::: .:::::::.:: .:::::.::: .:. .:.: :.::..:::::: CCDS75 ALKSEDCFILDHGKDGKIFVWKGKQANTEERKAALKTASDFITKMDYPKQTQVSVLPEGG 310 320 330 340 350 360 340 350 360 370 380 390 pF1KE1 ETPIFKQFFKDWRDKDQSDGFGKVYVTEKVAQIKQIPFDASKLHSSPQMAAQHNMVDDGS :::.::::::.::: ::.::.: :.. ..:.....::::. ::.: :::::.: :::. CCDS75 ETPLFKQFFKNWRDPDQTDGLGLSYLSSHIANVERVPFDAATLHTSTAMAAQHGMDDDGT 370 380 390 400 410 420 400 410 420 430 440 450 pF1KE1 GKVEIWRVENNGRIQVDQNSYGEFYGGDCYIILYTYP----RGQIIYTWQGANATRDELT :. .:::.:..... :: .::.::::: :::::.: .:::::.::::..:.::.. CCDS75 GQKQIWRIEGSNKVPVDPATYGQFYGGDSYIILYNYRHGGRQGQIIYNWQGAQSTQDEVA 430 440 450 460 470 480 460 470 480 490 500 510 pF1KE1 TSAFLTVQLDRSLGGQAVQIRVSQGKEPVHLLSLFKDKPLIIYKNGTSKKGGQAPAPPTR .::.::.:::. ::: :: :: :::::.::.::: ::.::::.:::..:::. :: CCDS75 ASAILTAQLDEELGGTPVQSRVVQGKEPAHLMSLFGGKPMIIYKGGTSREGGQTAPASTR 490 500 510 520 530 540 520 530 540 550 560 570 pF1KE1 LFQVRRNLASITRIVEVDVDANSLNSNDVFVLKLPQNSGYIWVGKGASQEEEKGAEYVAS ::::: : :. :: ::: :..:::::.:::: : ...:.::: :::. :. ::. . CCDS75 LFQVRANSAGATRAVEVLPKAGALNSNDAFVLKTP-SAAYLWVGTGASEAEKTGAQELLR 550 560 570 580 590 600 580 590 600 610 620 630 pF1KE1 VLKCKTLRIQEGEEPEEFWNSLGGKKDYQTSPLLETQAED-HPPRLYGCSNKTGRFVIEE ::. . ... :: ::. ::..:::: :.::: :. . : :::::..:::: ::::::: CCDS75 VLRAQPVQVAEGSEPDGFWEALGGKAAYRTSPRLKDKKMDAHPPRLFACSNKIGRFVIEE 610 620 630 640 650 660 640 650 660 670 680 690 pF1KE1 IPGEFTQDDLAEDDVMLLDAWEQIFIWIGKDANEVEKKESLKSAKMYLETDPSGRDKRTP .:::. :.::: :::::::.:.:.:.:.:::..: :: :.: ::: :.::::..::.::: CCDS75 VPGELMQEDLATDDVMLLDTWDQVFVWVGKDSQEEEKTEALTSAKRYIETDPANRDRRTP 670 680 690 700 710 720 700 710 pF1KE1 IVIIKQGHEPPTFTGWFLGWDSSKW :...::: :::.:.:::::::.. : CCDS75 ITVVKQGFEPPSFVGWFLGWDDDYWSVDPLDRAMAELAA 730 740 750 760 >>CCDS6828.1 GSN gene_id:2934|Hs108|chr9 (782 aa) initn: 2072 init1: 994 opt: 3085 Z-score: 3737.2 bits: 702.2 E(32554): 7.7e-202 Smith-Waterman score: 3085; 60.3% identity (84.8% similar) in 715 aa overlap (7-715:56-768) 10 20 30 pF1KE1 MARELYHEEFARAGKQAGLQVWRIEKLELVPVPQSA : :: .:::. :::.::.::..::::: . CCDS68 RAATASRGASQAGAPQGRVPEARPNSMVVEHPEFLKAGKEPGLQIWRVEKFDLVPVPTNL 30 40 50 60 70 80 40 50 60 70 80 90 pF1KE1 HGDFYVGDAYLVLHTAKTSRG-FTYRLHFWLGKECSQDESTAAAIFTVQMDDYLGGKPVQ .:::..::::..:.:.. : . : ::.:::.::::::: ::::::::.::::.:. :: CCDS68 YGDFFTGDAYVILKTVQLRNGNLQYDLHYWLGNECSQDESGAAAIFTVQLDDYLNGRAVQ 90 100 110 120 130 140 100 110 120 130 140 150 pF1KE1 NRELQGYESNDFVSYFKGGLKYKAGGVASGLNHVLTNDLTAKRLLHVKGRRVVRATEVPL .::.::.:: :..:::.::::: ::::::..::. :.....::..:::::::::::::. CCDS68 HREVQGFESATFLGYFKSGLKYKKGGVASGFKHVVPNEVVVQRLFQVKGRRVVRATEVPV 150 160 170 180 190 200 160 170 180 190 200 210 pF1KE1 SWDSFNKGDCFIIDLGTEIYQWCGSSCNKYERLKANQVATGIRYNERKGRSELIVVEEGS ::.:::.:::::.:::..:.:::::. :.::::::.::. ::: :::.::... : :::. CCDS68 SWESFNNGDCFILDLGNNIHQWCGSNSNRYERLKATQVSKGIRDNERSGRARVHVSEEGT 210 220 230 240 250 260 220 230 240 250 260 270 pF1KE1 EPSELIKVLGEKPELPDGGDDDDIIADISNRKMAKLYMVSDASGSMRVTVVAEENPFSMA :: ...::: :: :: .: .: : .:::.:::: ::...:.: :..::.::::... CCDS68 EPEAMLQVLGPKPALP-AGTEDTAKEDAANRKLAKLYKVSNGAGTMSVSLVADENPFAQG 270 280 290 300 310 320 280 290 300 310 320 330 pF1KE1 MLLSEECFILDHGAAKQIFVWKGKDANPQERKAAMKTAEEFLQQMNYSKNTQIQVLPEGG : ::.::::::: .:::::::.:: .:::::.::: .:. .:.: :.::..:::::: CCDS68 ALKSEDCFILDHGKDGKIFVWKGKQANTEERKAALKTASDFITKMDYPKQTQVSVLPEGG 330 340 350 360 370 380 340 350 360 370 380 390 pF1KE1 ETPIFKQFFKDWRDKDQSDGFGKVYVTEKVAQIKQIPFDASKLHSSPQMAAQHNMVDDGS :::.::::::.::: ::.::.: :.. ..:.....::::. ::.: :::::.: :::. CCDS68 ETPLFKQFFKNWRDPDQTDGLGLSYLSSHIANVERVPFDAATLHTSTAMAAQHGMDDDGT 390 400 410 420 430 440 400 410 420 430 440 450 pF1KE1 GKVEIWRVENNGRIQVDQNSYGEFYGGDCYIILYTYP----RGQIIYTWQGANATRDELT :. .:::.:..... :: .::.::::: :::::.: .:::::.::::..:.::.. CCDS68 GQKQIWRIEGSNKVPVDPATYGQFYGGDSYIILYNYRHGGRQGQIIYNWQGAQSTQDEVA 450 460 470 480 490 500 460 470 480 490 500 510 pF1KE1 TSAFLTVQLDRSLGGQAVQIRVSQGKEPVHLLSLFKDKPLIIYKNGTSKKGGQAPAPPTR .::.::.:::. ::: :: :: :::::.::.::: ::.::::.:::..:::. :: CCDS68 ASAILTAQLDEELGGTPVQSRVVQGKEPAHLMSLFGGKPMIIYKGGTSREGGQTAPASTR 510 520 530 540 550 560 520 530 540 550 560 570 pF1KE1 LFQVRRNLASITRIVEVDVDANSLNSNDVFVLKLPQNSGYIWVGKGASQEEEKGAEYVAS ::::: : :. :: ::: :..:::::.:::: : ...:.::: :::. :. ::. . CCDS68 LFQVRANSAGATRAVEVLPKAGALNSNDAFVLKTP-SAAYLWVGTGASEAEKTGAQELLR 570 580 590 600 610 620 580 590 600 610 620 630 pF1KE1 VLKCKTLRIQEGEEPEEFWNSLGGKKDYQTSPLLETQAED-HPPRLYGCSNKTGRFVIEE ::. . ... :: ::. ::..:::: :.::: :. . : :::::..:::: ::::::: CCDS68 VLRAQPVQVAEGSEPDGFWEALGGKAAYRTSPRLKDKKMDAHPPRLFACSNKIGRFVIEE 630 640 650 660 670 680 640 650 660 670 680 690 pF1KE1 IPGEFTQDDLAEDDVMLLDAWEQIFIWIGKDANEVEKKESLKSAKMYLETDPSGRDKRTP .:::. :.::: :::::::.:.:.:.:.:::..: :: :.: ::: :.::::..::.::: CCDS68 VPGELMQEDLATDDVMLLDTWDQVFVWVGKDSQEEEKTEALTSAKRYIETDPANRDRRTP 690 700 710 720 730 740 700 710 pF1KE1 IVIIKQGHEPPTFTGWFLGWDSSKW :...::: :::.:.:::::::.. : CCDS68 ITVVKQGFEPPSFVGWFLGWDDDYWSVDPLDRAMAELAA 750 760 770 780 >>CCDS8959.1 AVIL gene_id:10677|Hs108|chr12 (819 aa) initn: 1970 init1: 772 opt: 2324 Z-score: 2813.7 bits: 531.4 E(32554): 2.1e-150 Smith-Waterman score: 2331; 49.4% identity (74.5% similar) in 722 aa overlap (10-715:7-716) 10 20 30 40 50 60 pF1KE1 MARELYHEEFARAGKQAGLQVWRIEKLELVPVPQSAHGDFYVGDAYLVLHTAKTSRGFTY : . .. :. ::::::.::. :: ::::.:: :: :..: : ... .. CCDS89 MPLTSAFRAVDNDPGIIVWRIEKMELALVPVSAHGNFYEGDCYVILSTRRVASLLSQ 10 20 30 40 50 70 80 90 100 110 120 pF1KE1 RLHFWLGKECSQDESTAAAIFTVQMDDYLGGKPVQNRELQGYESNDFVSYFKGGLKYKAG .:::.::. ::::.. :::.:.:.::::::.:::.::.: .::. : .::: :. :: : CCDS89 DIHFWIGKDSSQDEQSCAAIYTTQLDDYLGGSPVQHREVQYHESDTFRGYFKQGIIYKQG 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE1 GVASGLNHVLTNDLTAKRLLHVKGRRVVRATEVPLSWDSFNKGDCFIIDLGTEIYQWCGS :::::..:: :: .::::::::.: .::::: .::::::.:: :..::: : :: : CCDS89 GVASGMKHVETNTYDVKRLLHVKGKRNIRATEVEMSWDSFNRGDVFLLDLGKVIIQWNGP 120 130 140 150 160 170 190 200 210 220 230 pF1KE1 SCNKYERLKANQVATGIRYNERKGRSELIVVEEGSEPS--ELIKVLGE--------KPEL :. ::::: .: :: :: ::... :.: .: . ::.::: . :: . CCDS89 ESNSGERLKAMLLAKDIRDRERGGRAKIGVIEGDKEAASPELMKVLQDTLGRRSIIKPTV 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE1 PDGGDDDDIIADISNRKMAKLYMVSDASGSMRVTVVAEENPFSMAMLLSEECFILDHGAA :: .:: : .... :: .::..:.. :: :: . :. . .: ..:.:::.... CCDS89 PD-----EII-DQKQKSTIMLYHISDSAGQLAVTEVATR-PLVQDLLNHDDCYILDQSGT 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE1 KQIFVWKGKDANPQERKAAMKTAEEFLQQMNYSKNTQIQVLPEGGETPIFKQFFKDWRDK : :.::::: :. :..:::. : :... .: ..:..... .:.:. .:::.:. : : CCDS89 K-IYVWKGKGATKAEKQAAMSKALGFIKMKSYPSSTNVETVNDGAESAMFKQLFQKWSVK 300 310 320 330 340 360 370 380 390 400 410 pF1KE1 DQSDGFGKVYVTEKVAQIKQIPFDASKLHSSPQMAAQHNMVDDGSGKVEIWRVENNGRIQ ::. :.::.. :.:.. : ::.. ::..:..:::. :::::.::::.::.:: . CCDS89 DQTMGLGKTFSIGKIAKVFQDKFDVTLLHTKPEVAAQERMVDDGNGKVEVWRIENLELVP 350 360 370 380 390 400 420 430 440 450 460 pF1KE1 VDQNSYGEFYGGDCYIILYTYP-RGQ---IIYTWQGANATRDELTTSAFLTVQLDRSLGG :. . :: :::::::..:::: :. :.: ::: .:..:::..::. .:..::.. : CCDS89 VEYQWYGFFYGGDCYLVLYTYEVNGKPHHILYIWQGRHASQDELAASAYQAVEVDRQFDG 410 420 430 440 450 460 470 480 490 500 510 520 pF1KE1 QAVQIRVSQGKEPVHLLSLFKDKPLIIYKNGTSKKGGQAPAPPTRLFQVRRNLASITRIV :::.:: .: :: :....:: : :.:...:::.::. : ::.::::.. : : :. : CCDS89 AAVQVRVRMGTEPRHFMAIFKGK-LVIFEGGTSRKGNAEPDPPVRLFQIHGNDKSNTKAV 470 480 490 500 510 520 530 540 550 560 570 580 pF1KE1 EVDVDANSLNSNDVFVLKLPQNSGYIWVGKGASQEEEKGAEYVASVLKCKTLR--IQEGE :: . :.::::::::.:. : :.: :::.: .:. :. .::.: : . . ::. CCDS89 EVPAFASSLNSNDVFLLRT-QAEHYLWYGKGSSGDERAMAKELASLL-CDGSENTVAEGQ 530 540 550 560 570 580 590 600 610 620 630 640 pF1KE1 EPEEFWNSLGGKKDYQTSPLLETQAEDHPPRLYGCSNKTGRFVIEEIPGEFTQDDLAEDD :: :::. :::: : .. :. . : ::. ::::::.::. :: .:::::: : CCDS89 EPAEFWDLLGGKTPYANDKRLQQEILDVQSRLFECSNKTGQFVVTEIT-DFTQDDLNPTD 590 600 610 620 630 640 650 660 670 680 690 700 pF1KE1 VMLLDAWEQIFIWIGKDANEVEKKESLKSAKMYLETDPSGRDKRTPIVIIKQGHEPPTFT :::::.:.:.:.::: .:: .::. .: .:..::.: ::::: :::.::::: ::: :: CCDS89 VMLLDTWDQVFLWIGAEANATEKESALATAQQYLHTHPSGRDPDTPILIIKQGFEPPIFT 650 660 670 680 690 700 710 pF1KE1 GWFLGWDSSKW ::::.:: . : CCDS89 GWFLAWDPNIWSAGKTYEQLKEELGDAAAIMRITADMKNATLSLNSNDSEPKYYPIAVLL 710 720 730 740 750 760 >>CCDS2417.1 VIL1 gene_id:7429|Hs108|chr2 (827 aa) initn: 1818 init1: 703 opt: 2293 Z-score: 2776.0 bits: 524.4 E(32554): 2.6e-148 Smith-Waterman score: 2293; 48.4% identity (75.9% similar) in 709 aa overlap (18-715:18-719) 10 20 30 40 50 60 pF1KE1 MARELYHEEFARAGKQAGLQVWRIEKLELVPVPQSAHGDFYVGDAYLVLHTAKTSRGFTY :::.:::: ...::::.:. :.:. :: :..: ::. ...: CCDS24 MTKLSAQVKGSLNITTPGLQIWRIEAMQMVPVPSSTFGSFFDGDCYIILAIHKTASSLSY 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 RLHFWLGKECSQDESTAAAIFTVQMDDYLGGKPVQNRELQGYESNDFVSYFKGGLKYKAG .:.:.:.. : ::. ::::.:.::::.: :. ::.::.:: ::. : .::: :: . : CCDS24 DIHYWIGQDSSLDEQGAAAIYTTQMDDFLKGRAVQHREVQGNESEAFRGYFKQGLVIRKG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 GVASGLNHVLTNDLTAKRLLHVKGRRVVRATEVPLSWDSFNKGDCFIIDLGTEIYQWCGS :::::..:: ::. ..:::::::.: : : :: .:: :::.:: :..::: : :: : CCDS24 GVASGMKHVETNSYDVQRLLHVKGKRNVVAGEVEMSWKSFNRGDVFLLDLGKLIIQWNGP 130 140 150 160 170 180 190 200 210 220 230 pF1KE1 SCNKYERLKANQVATGIRYNERKGRSELIVVE---EGSEPS--ELIK-VLGEKPELPDGG ...:::.. .: :: .:: ::. . ::. : . :. :... :::.. :: . CCDS24 ESTRMERLRGMTLAKEIRDQERGGRTYVGVVDGENELASPKLMEVMNHVLGKRRELKAAV 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE1 DDDDIIADISNRKMAKLYMVSDASGSMRVTVVAEENPFSMAMLLSEECFILDHGAAKQIF : ... . . ::: :::. :.. : :: . :... .: :.:.:::.:. : :. CCDS24 PDT--VVEPALKAALKLYHVSDSEGNLVVREVATR-PLTQDLLSHEDCYILDQGGLK-IY 250 260 270 280 290 300 310 320 330 340 350 pF1KE1 VWKGKDANPQERKAAMKTAEEFLQQMNYSKNTQIQVLPEGGETPIFKQFFKDWRDKDQSD ::::: :: ::.:.::. : .:.. .: .::..: .:.:. .:.:.:. : ..... CCDS24 VWKGKKANEQEKKGAMSHALNFIKAKQYPPSTQVEVQNDGAESAVFQQLFQKWTASNRTS 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE1 GFGKVYVTEKVAQIKQIPFDASKLHSSPQMAAQHNMVDDGSGKVEIWRVENNGRIQVDQN :.::.... .::...:. :::...: .::.:::..:::::::.:..::.:: . ::.. CCDS24 GLGKTHTVGSVAKVEQVKFDATSMHVKPQVAAQQKMVDDGSGEVQVWRIENLELVPVDSK 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE1 SYGEFYGGDCYIILYTYPRGQ----IIYTWQGANATRDELTTSAFLTVQLDRSLGGQAVQ :.:::::::..:::: :. ..:.:::..:..::.:.::. .: ::.. .:. :: CCDS24 WLGHFYGGDCYLLLYTYLIGEKQHYLLYVWQGSQASQDEITASAYQAVILDQKYNGEPVQ 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE1 IRVSQGKEPVHLLSLFKDKPLIIYKNGTSKKGGQAPAPPTRLFQVRRNLASITRIVEVDV ::: .:::: ::.:.:: . ...:..:::. .. .: ::::::. . :. :. :: . CCDS24 IRVPMGKEPPHLMSIFKGR-MVVYQGGTSRTNNLETGPSTRLFQVQGTGANNTKAFEVPA 480 490 500 510 520 530 540 550 560 570 580 pF1KE1 DANSLNSNDVFVLKLPQNSGYIWVGKGASQEEEKGAEYVA-SVLKCKTLRIQEGEEPEEF :: :::::::::: :. :.: ::: : .:.. :..:: .. . . . ::.:: .: CCDS24 RANFLNSNDVFVLKT-QSCCYLWCGKGCSGDEREMAKMVADTISRTEKQVVVEGQEPANF 540 550 560 570 580 590 590 600 610 620 630 640 pF1KE1 WNSLGGKKDYQTSPLLETQAEDHPPRLYGCSNKTGRFVIEEIPGEFTQDDLAEDDVMLLD : .:::: : .. :. . :::. ::::::::. ::: .:.:::: ::::.::: CCDS24 WMALGGKAPYANTKRLQEENLVITPRLFECSNKTGRFLATEIP-DFNQDDLEEDDVFLLD 600 610 620 630 640 650 650 660 670 680 690 700 pF1KE1 AWEQIFIWIGKDANEVEKKESLKSAKMYLETDPSGRDKRTPIVIIKQGHEPPTFTGWFLG .:.:.:.:::: ::: ::: . .:. ::.: ::::: .:::...::::::::::::::. CCDS24 VWDQVFFWIGKHANEEEKKAAATTAQEYLKTHPSGRDPETPIIVVKQGHEPPTFTGWFLA 660 670 680 690 700 710 710 pF1KE1 WDSSKW :: :: CCDS24 WDPFKWSNTKSYEDLKAELGNSRDWSQITAEVTSPKVDVFNANSNLSSGPLPIFPLEQLV 720 730 740 750 760 770 715 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 22:44:08 2016 done: Sun Nov 6 22:44:08 2016 Total Scan time: 2.120 Total Display time: 0.140 Function used was FASTA [36.3.4 Apr, 2011]