FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE6770, 555 aa 1>>>pF1KE6770 555 - 555 aa - 555 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.3610+/-0.000889; mu= 18.7207+/- 0.053 mean_var=69.9219+/-13.709, 0's: 0 Z-trim(106.3): 25 B-trim: 0 in 0/49 Lambda= 0.153380 statistics sampled from 8919 (8932) to 8919 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.644), E-opt: 0.2 (0.274), width: 16 Scan time: 2.410 The best scores are: opt bits E(32554) CCDS9469.1 GPC6 gene_id:10082|Hs108|chr13 ( 555) 3741 837.1 0 CCDS14637.1 GPC4 gene_id:2239|Hs108|chrX ( 556) 2422 545.2 7.4e-155 CCDS5689.1 GPC2 gene_id:221914|Hs108|chr7 ( 579) 1565 355.6 9.4e-98 CCDS2534.1 GPC1 gene_id:2817|Hs108|chr2 ( 558) 1320 301.4 1.9e-81 CCDS9468.1 GPC5 gene_id:2262|Hs108|chr13 ( 572) 756 176.6 7.2e-44 CCDS14638.1 GPC3 gene_id:2719|Hs108|chrX ( 580) 687 161.3 2.9e-39 CCDS55496.1 GPC3 gene_id:2719|Hs108|chrX ( 603) 569 135.2 2.1e-31 CCDS55495.1 GPC3 gene_id:2719|Hs108|chrX ( 526) 558 132.8 1e-30 >>CCDS9469.1 GPC6 gene_id:10082|Hs108|chr13 (555 aa) initn: 3741 init1: 3741 opt: 3741 Z-score: 4471.0 bits: 837.1 E(32554): 0 Smith-Waterman score: 3741; 100.0% identity (100.0% similar) in 555 aa overlap (1-555:1-555) 10 20 30 40 50 60 pF1KE6 MPSWIGAVILPLLGLLLSLPAGADVKARSCGEVRQAYGAKGFSLADIPYQEIAGEHLRIC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 MPSWIGAVILPLLGLLLSLPAGADVKARSCGEVRQAYGAKGFSLADIPYQEIAGEHLRIC 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 PQEYTCCTTEMEDKLSQQSKLEFENLVEETSHFVRTTFVSRHKKFDEFFRELLENAEKSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 PQEYTCCTTEMEDKLSQQSKLEFENLVEETSHFVRTTFVSRHKKFDEFFRELLENAEKSL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 NDMFVRTYGMLYMQNSEVFQDLFTELKRYYTGGNVNLEEMLNDFWARLLERMFQLINPQY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 NDMFVRTYGMLYMQNSEVFQDLFTELKRYYTGGNVNLEEMLNDFWARLLERMFQLINPQY 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 HFSEDYLECVSKYTDQLKPFGDVPRKLKIQVTRAFIAARTFVQGLTVGREVANRVSKVSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 HFSEDYLECVSKYTDQLKPFGDVPRKLKIQVTRAFIAARTFVQGLTVGREVANRVSKVSP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE6 TPGCIRALMKMLYCPYCRGLPTVRPCNNYCLNVMKGCLANQADLDTEWNLFIDAMLLVAE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 TPGCIRALMKMLYCPYCRGLPTVRPCNNYCLNVMKGCLANQADLDTEWNLFIDAMLLVAE 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE6 RLEGPFNIESVMDPIDVKISEAIMNMQENSMQVSAKVFQGCGQPKPAPALRSARSAPENF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 RLEGPFNIESVMDPIDVKISEAIMNMQENSMQVSAKVFQGCGQPKPAPALRSARSAPENF 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE6 NTRFRPYNPEERPTTAAGTSLDRLVTDIKEKLKLSKKVWSALPYTICKDESVTAGTSNEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 NTRFRPYNPEERPTTAAGTSLDRLVTDIKEKLKLSKKVWSALPYTICKDESVTAGTSNEE 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE6 ECWNGHSKARYLPEIMNDGLTNQINNPEVDVDITRPDTFIRQQIMALRVMTNKLKNAYNG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 ECWNGHSKARYLPEIMNDGLTNQINNPEVDVDITRPDTFIRQQIMALRVMTNKLKNAYNG 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE6 NDVNFQDTSDESSGSGSGSGCMDDVCPTEFEFVTTEAPAVDPDRREVDSSAAQRGHSLLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS94 NDVNFQDTSDESSGSGSGSGCMDDVCPTEFEFVTTEAPAVDPDRREVDSSAAQRGHSLLS 490 500 510 520 530 540 550 pF1KE6 WSLTCIVLALQRLCR ::::::::::::::: CCDS94 WSLTCIVLALQRLCR 550 >>CCDS14637.1 GPC4 gene_id:2239|Hs108|chrX (556 aa) initn: 2398 init1: 1676 opt: 2422 Z-score: 2893.6 bits: 545.2 E(32554): 7.4e-155 Smith-Waterman score: 2422; 64.5% identity (86.1% similar) in 546 aa overlap (9-552:9-553) 10 20 30 40 50 60 pF1KE6 MPSWIGAVILPLLGLLLSLPAGADVKARSCGEVRQAYGAKGFSLADIPYQEIAGEHLRIC .: :..: . .:..:..::.:::. : .:::. : : .:: :.::.:: CCDS14 MARFGLPALLCTLAVLSAALLAAELKSKSCSEVRRLYVSKGFNKNDAPLHEINGDHLKIC 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 PQEYTCCTTEMEDKLSQQSKLEFENLVEETSHFVRTTFVSRHKKFDEFFRELLENAEKSL :: :::. :::.: : ::: .:...: : . ....:.::.:::::::.:::::::::: CCDS14 PQGSTCCSQEMEEKYSLQSKDDFKSVVSEQCNHLQAVFASRYKKFDEFFKELLENAEKSL 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 NDMFVRTYGMLYMQNSEVFQDLFTELKRYYTGGNVNLEEMLNDFWARLLERMFQLINPQY :::::.::: :::::::.:.:::.::::::. :::::::::::::::::::::.:.: :: CCDS14 NDMFVKTYGHLYMQNSELFKDLFVELKRYYVVGNVNLEEMLNDFWARLLERMFRLVNSQY 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 HFSEDYLECVSKYTDQLKPFGDVPRKLKIQVTRAFIAARTFVQGLTVGREVANRVSKVSP ::...:::::::::.:::::::::::::.::::::.:::::.:::.:. .:...:: :.: CCDS14 HFTDEYLECVSKYTEQLKPFGDVPRKLKLQVTRAFVAARTFAQGLAVAGDVVSKVSVVNP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE6 TPGCIRALMKMLYCPYCRGLPTVRPCNNYCLNVMKGCLANQADLDTEWNLFIDAMLLVAE : : .::.::.:: .:::: ::.:: ::: :.:.::::::.::: ::: ::::::.::: CCDS14 TAQCTHALLKMIYCSHCRGLVTVKPCYNYCSNIMRGCLANQGDLDFEWNNFIDAMLMVAE 250 260 270 280 290 300 310 320 330 340 350 pF1KE6 RLEGPFNIESVMDPIDVKISEAIMNMQENSMQVSAKVFQGCGQPKPAPALRSARSAPEN- ::::::::::::::::::::.::::::.::.::: ::::::: ::: :: : .:: :. CCDS14 RLEGPFNIESVMDPIDVKISDAIMNMQDNSVQVSQKVFQGCGPPKPLPAGRISRSISESA 310 320 330 340 350 360 360 370 380 390 400 410 pF1KE6 FNTRFRPYNPEERPTTAAGTSLDRLVTDIKEKLKLSKKVWSALPYTICKDESVTAGTSNE :..::::..:::::::::::::::::::.::::: .:: ::.:: ..:.:: ..::..:: CCDS14 FSARFRPHHPEERPTTAAGTSLDRLVTDVKEKLKQAKKFWSSLPSNVCNDERMAAGNGNE 370 380 390 400 410 420 420 430 440 450 460 470 pF1KE6 EECWNGHSKARYLPEIMNDGLTNQINNPEVDVDITRPDTFIRQQIMALRVMTNKLKNAYN ..::::..:.::: . ..::.:: :::::.:: ..:: .: .:::::::::.:.::::: CCDS14 DDCWNGKGKSRYLFAVTGNGLANQGNNPEVQVDTSKPDILILRQIMALRVMTSKMKNAYN 430 440 450 460 470 480 480 490 500 510 520 530 pF1KE6 GNDVNFQDTSDESSGSGSGSGCMDDVCPTEFEFVTTEAPAVDPDRREVDSSAAQRGHSLL ::::.: : :::::: :::::: . ::.::.. .:. . . ... .::.... : . CCDS14 GNDVDFFDISDESSGEGSGSGCEYQQCPSEFDYNATDHAGKSANEK-ADSAGVRPGAQAY 490 500 510 520 530 540 550 pF1KE6 SWSLTCIV-LALQRLCR .. ::. :..:: CCDS14 LLTVFCILFLVMQREWR 540 550 >>CCDS5689.1 GPC2 gene_id:221914|Hs108|chr7 (579 aa) initn: 1066 init1: 593 opt: 1565 Z-score: 1868.5 bits: 355.6 E(32554): 9.4e-98 Smith-Waterman score: 1565; 45.5% identity (77.0% similar) in 508 aa overlap (11-504:6-511) 10 20 30 40 50 pF1KE6 MPSWIGAVILPLLGLLLSL-PA-----GADVKA-RSCGEVRQAYGAKGFSLADIPYQEIA ::: ::: : :. :...:. :::.:.::. ::.:.:: :: :. CCDS56 MSALRPLLLLLLPLCPGPGPGPGSEAKVTRSCAETRQVLGARGYSLNLIPPALIS 10 20 30 40 50 60 70 80 90 100 110 pF1KE6 GEHLRICPQEYTCCTTEMEDKLSQQSKLEFENLVEETSHFVRTTFVSRHKKFDEFFRELL :::::.::::::::..: :..: .... :..:::... :. :...::.:::::: :.: CCDS56 GEHLRVCPQEYTCCSSETEQRLIRETEATFRGLVEDSGSFLVHTLAARHRKFDEFFLEML 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE6 ENAEKSLNDMFVRTYGMLYMQNSEVFQDLFTELKRYYTGGNVNLEEMLNDFWARLLERMF :..::...: ..:: :: :.. .:. ::..:. .: .. .:.. : ::::.::::.: CCDS56 SVAQHSLTQLFSHSYGRLYAQHALIFNGLFSRLRDFYGESGEGLDDTLADFWAQLLERVF 120 130 140 150 160 170 180 190 200 210 220 pF1KE6 QLINPQYHFSEDYLECVSKY---TD-QLKPFGDVPRKLKIQVTRAFIAARTFVQGLTVGR :..::: : ::: :.:. :: .:.:::: ::.:..:.::...:::.::::: .:: CCDS56 PLLHPQYSFPPDYLLCLSRLASSTDGSLQPFGDSPRRLRLQITRTLVAARAFVQGLETGR 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE6 EVANRVSKVSPTPGCIRALMKMLYCPYCRGLPTVRPCNNYCLNVMKGCLANQADLDTEWN .:.... :: . :: .:::... :: :::.:.. ::...::::..:::.... :. .:. CCDS56 NVVSEALKVPVSEGCSQALMRLIGCPLCRGVPSLMPCQGFCLNVVRGCLSSRG-LEPDWG 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE6 LFIDAMLLVAERLEGPFNIESVMDPIDVKISEAIMNMQENSMQVSAKVFQGCGQPKPAPA ..:..:..:..:.:::..: . . : :::::..: .:::: .:::.::: :: : :.:: CCDS56 NYLDGLLILADKLQGPFSFELTAESIGVKISEGLMYLQENSAKVSAQVFQECGPPDPVPA 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE6 LRSARSAP--ENFNTRFRPYNPEERPTTAAGTSLDRLVTDIKEKLKLSKKVWSALPYTIC :. :. : :. . . . ::::::::::.: ::: ...:.: . :. : :.: CCDS56 -RNRRAPPPREEAGRLWSMVTEEERPTTAAGTNLHRLVWELRERLARMRGFWARLSLTVC 360 370 380 390 400 410 410 420 430 440 450 460 pF1KE6 KDESVTAGTSNEEE-CWNGHSKARYLPEIMNDGLTNQINNPEVDVDITRPDTFIRQQIMA : ..: .: : ::.: ...:::: ... . ..:.::::. :: . ::. :.. . CCDS56 GDSRMAADASLEAAPCWTGAGRGRYLPPVVGGSPAEQVNNPELKVDASGPDVPTRRRRLQ 420 430 440 450 460 470 470 480 490 500 510 520 pF1KE6 LRVMTNKLKNAYNGNDVNFQDTSDESSGSGSGSGCMDDVCPTEFEFVTTEAPAVDPDRRE ::. : ..:.: :.:.. ::.....::::.:. :: CCDS56 LRAATARMKTAALGHDLDGQDADEDASGSGGGQQYADDWMAGAVAPPARPPRPPYPPRRD 480 490 500 510 520 530 530 540 550 pF1KE6 VDSSAAQRGHSLLSWSLTCIVLALQRLCR CCDS56 GSGGKGGGGSARYNQGRSRSGGASIGFHTQTILILSLSALALLGPR 540 550 560 570 >>CCDS2534.1 GPC1 gene_id:2817|Hs108|chr2 (558 aa) initn: 1719 init1: 1204 opt: 1320 Z-score: 1575.7 bits: 301.4 E(32554): 1.9e-81 Smith-Waterman score: 1766; 49.1% identity (80.3% similar) in 503 aa overlap (4-506:9-499) 10 20 30 40 50 pF1KE6 MPSWIGAVILPLLGLLLSLPAGADVKARSCGEVRQAYGAKGFSLADIPYQEIAGE :. . :.. . ::. :.:::::::: ::::::::.:.: ::.:: CCDS25 MELRARGWWLLCAAAALVACARGDPAS---KSRSCGEVRQIYGAKGFSLSDVPQAEISGE 10 20 30 40 50 60 70 80 90 100 110 pF1KE6 HLRICPQEYTCCTTEMEDKLSQQSKLEFENLVEETSHFVRTTFVSRHKKFDEFFRELLEN ::::::: :::::.:::..:...:. :.:. ....:. ... .... ..::. :..::.. CCDS25 HLRICPQGYTCCTSEMEENLANRSHAELETALRDSSRVLQAMLATQLRSFDDHFQHLLND 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE6 AEKSLNDMFVRTYGMLYMQNSEVFQDLFTELKRYYTGGNVNLEEMLNDFWARLLERMFQL .:..:. : ..: :: ::...:.::..::. :: :.:..::: : .::::::::.:. CCDS25 SERTLQATFPGAFGELYTQNARAFRDLYSELRLYYRGANLHLEETLAEFWARLLERLFKQ 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE6 INPQYHFSEDYLECVSKYTDQLKPFGDVPRKLKIQVTRAFIAARTFVQGLTVGREVANRV ..:: . .:::.:..: .. :.:::..::.:....::::.:::.::::: :. .:. .: CCDS25 LHPQLLLPDDYLDCLGKQAEALRPFGEAPRELRLRATRAFVAARSFVQGLGVASDVVRKV 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE6 SKVSPTPGCIRALMKMLYCPYCRGLPTVRPCNNYCLNVMKGCLANQADLDTEWNLFIDAM ..: : : ::.::..:: .: :.: .::: .:: ::.:::::::::::.:: ..:.: CCDS25 AQVPLGPECSRAVMKLVYCAHCLGVPGARPCPDYCRNVLKGCLANQADLDAEWRNLLDSM 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE6 LLVAERLEGPFNIESVMDPIDVKISEAIMNMQENSMQVSAKVFQGCGQPKPAPALRSARS .:..... : ..:::. . . ..::: .:.: ..:::.::::.:: : CCDS25 VLITDKFWGTSGVESVIGSVHTWLAEAINALQDNRDTLTAKVIQGCGNPKVNP----QGP 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE6 APENFNTRFRPYNPEERPTTAAGTSLDRLVTDIKEKLKLSKKVWSALPYTICKDESVTAG .::. : . :.::: . :: :..::.. : .:. . : .:: :.:. :... . CCDS25 GPEEKRRRGK-LAPRERPPS--GT-LEKLVSEAKAQLRDVQDFWISLPGTLCS-EKMALS 360 370 380 390 400 420 430 440 450 460 470 pF1KE6 TSNEEECWNGHSKARYLPEIMNDGLTNQINNPEVDVDITRPDTFIRQQIMALRVMTNKLK :.....:::: ...:::::.:.:::.::::::::.::::.:: :::::: :..:::.:. CCDS25 TASDDRCWNGMARGRYLPEVMGDGLANQINNPEVEVDITKPDMTIRQQIMQLKIMTNRLR 410 420 430 440 450 460 480 490 500 510 520 530 pF1KE6 NAYNGNDVNFQDTSDESSGSGSGSGCMDDVCPTEFEFVTTEAPAVDPDRREVDSSAAQRG .:::::::.:::.::..::::::.::.::.: CCDS25 SAYNGNDVDFQDASDDGSGSGSGDGCLDDLCSRKVSRKSSSSRTPLTHALPGLSEQEGQK 470 480 490 500 510 520 540 550 pF1KE6 HSLLSWSLTCIVLALQRLCR CCDS25 TSAASCPQPPTFLLPLLLFLALTVARPRWR 530 540 550 >>CCDS9468.1 GPC5 gene_id:2262|Hs108|chr13 (572 aa) initn: 654 init1: 427 opt: 756 Z-score: 901.1 bits: 176.6 E(32554): 7.2e-44 Smith-Waterman score: 758; 26.0% identity (61.6% similar) in 562 aa overlap (15-550:14-564) 10 20 30 40 50 pF1KE6 MPSWIGAVILPLLGLLLSLPAGADVKA-RSCGEVRQAYGAKGF-SLADIPYQEIAGEHLR :::.: ..: .. ..: :::. . . . .. .: . :: :. CCDS94 MDAQTWPVGFRCLLLLALVGSARSEGVQTCEEVRKLFQWRLLGAVRGLPDSPRAGPDLQ 10 20 30 40 50 60 70 80 90 100 110 pF1KE6 IC-PQEYTCCTTEMEDKLSQQSKLEFENLVEETSHFVRTTFVSRHKK-FDEFFRELLENA .: .. :::: .::.. . .. ....... .: .. ..::. :.: .. :...: CCDS94 VCISKKPTCCTRKMEERYQIAARQDMQQFLQTSSSTLKF-LISRNAAAFQETLETLIKQA 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE6 EKSLNDMFVRTYGMLYMQNSEVFQDLFTELKRYYTGGNVNLEEMLNDFWARLLERMF-QL :. . .: :: . .. . :..::.. : :..:: ::..: :. :. .. .: CCDS94 ENYTSILFCSTYRNMALEAAASVQEFFTDVGLYLFGADVNPEEFVNRFFDSLFPLVYNHL 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE6 INPQY-HFSEDYLECVSKYTDQLKPFGDVPRKLKIQVTRAFIAARTFVQGLTVGREVANR ::: : .: ::. ...:::..:... :. :... .:::.:.:..: :: : CCDS94 INPGVTDSSLEYSECIRMARRDVSPFGNIPQRVMGQMGRSLLPSRTFLQALNLGIEVINT 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE6 VSKVSPTPGCIRALMKMLYCPYCRGLPTVRPCNNYCLNVMKGCLANQADLDTEWNLFIDA .. . . : :::.:: :::.:.:: ..:: .::::::.::::..:.:. .:. .: . CCDS94 TDYLHFSKECSRALLKMQYCPHCQGLALTKPCMGYCLNVMRGCLAHMAELNPHWHAYIRS 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE6 MLLVAERLEGPFNIESVMDPIDVKISEAIMNMQENSMQVSAKVFQGCGQPKPAPALRSAR . ... ..: ..: :. . . ...:... . :.... .: . ::.: .:. CCDS94 LEELSDAMHGTYDIGHVLLNFHLLVNDAVLQAHLNGQKLLEQVNRICGRP-----VRTPT 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE6 SAPENFNTRFRPYNPEERPTTAAGTSLDRLVTDIKEKLKLSKKVWSALPYTICKDESVTA ..:. . . . . : . .: .. ..:.: .. ...: .: .: ..: CCDS94 QSPRCSFDQSKEKHGMKTTTRNSEETLANRRKEFINSLRLYRSFYGGLADQLCANELAAA 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE6 GTSNEEECWNGHSKAR-YLPEIMNDGLTNQINNPEVDVDITRP--DTFIRQQIMALRVMT . ::::.. .. : .....:. : .:::: : : . .: . ..... CCDS94 ---DGLPCWNGEDIVKSYTQRVVGNGIKAQSGNPEVKVKGIDPVINQIIDKLKHVVQLLQ 420 430 440 450 460 470 480 490 500 510 pF1KE6 NK--------LKNAYNGNDVNFQ---DTSDESSGSGSGSGC------MDDVCPTEFEFVT .. : . .:. . : : .::.. .::::: . : : ...: CCDS94 GRSPKPDKWELLQLGSGGGMVEQVSGDCDDEDGCGGSGSGEVKRTLKITDWMPDDMNFSD 480 490 500 510 520 530 520 530 540 550 pF1KE6 TEAPAVDPDRREVDSSAAQRGHSLLSWSLTCIVLALQRLCR .. .:...: : .. . :.: .... CCDS94 VKQIHQTDTGSTLDTTGA--GCAVATESMTFTLISVVMLLPGIW 540 550 560 570 >>CCDS14638.1 GPC3 gene_id:2719|Hs108|chrX (580 aa) initn: 606 init1: 338 opt: 687 Z-score: 818.5 bits: 161.3 E(32554): 2.9e-39 Smith-Waterman score: 690; 27.8% identity (58.9% similar) in 482 aa overlap (29-504:34-501) 10 20 30 40 50 pF1KE6 MPSWIGAVILPLLGLLLSLPAGADVKARSCGEVRQAYGAKGFSLADIPYQEIAGEHLR .: .::. . .: .: . : :. CCDS14 TVRTACLVVAMLLSLDFPGQAQPPPPPPDATCHQVRSFFQRLQPGLKWVPETPVPGSDLQ 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE6 IC-PQEYTCCTTEMEDKLSQQSKLEFENLVEETSHFVRTTFVSRHKKFDEFFRELLENAE .: :. :::. .::.: . ..:..:.:.. .: .. ... :.: :. ....:. CCDS14 VCLPKGPTCCSRKMEEKYQLTARLNMEQLLQSASMELKFLIIQNAAVFQEAFEIVVRHAK 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE6 KSLNDMFVRTYGMLYMQNSEVFQDLFTELKRYYTGGNVNLEEMLNDFWARLLERMF-QLI . : :: .: : : : ..::... : :...:...:.:... :. .. ::. CCDS14 NYTNAMFKNNYPSLTPQAFEFVGEFFTDVSLYILGSDINVDDMVNELFDSLFPVIYTQLM 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE6 NPQYHFSE-DYLECVSKYTDQLKPFGDVPRKLKIQVTRAFIAARTFVQGLTVGREVANRV :: : : ::. .:: ::. :. . ::.... ..: :.:.:..: :: : . CCDS14 NPGLPDSALDINECLRGARRDLKVFGNFPKLIMTQVSKSLQVTRIFLQALNLGIEVINTT 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE6 SKVSPTPGCIRALMKMLYCPYCRGLPTVRPCNNYCLNVMKGCLANQADLDTEWNLFIDAM .... . : : : .: :: ::.:: :.::..:: ::.::.:. ...: : .: .. CCDS14 DHLKFSKDCGRMLTRMWYCSYCQGLMMVKPCGGYCNVVMQGCMAGVVEIDKYWREYILSL 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE6 LLVAERLEGPFNIESVMDPIDVKISEAIMNMQENSMQVSAKVFQGCGQPKPAPALRSARS ... . ...:.:. . : ..:. .:.:. .... . . :.. . :. :: CCDS14 EELVNGMYRIYDMENVLLGLFSTIHDSIQYVQKNAGKLTTTIGKLCAHSQQ----RQYRS 310 320 330 340 350 360 370 380 390 400 410 pF1KE6 A--PENFNTRFRPYNPEERPTTAAGTSLDRLVTDIKEKLKLSKKVWSALPYTICKDESVT : ::.. : . . . .:. .. .::: . .:::: ::. :. CCDS14 AYYPEDL---FIDKKVLKVAHVEHEETLSSRRRELIQKLKSFISFYSALPGYICSHSPVA 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE6 AGTSNEEECWNGHSKA-RYLPEIMNDGLTNQINNPEVDVDITRPDTFIRQQIMALRVMTN :. ::::. . :: . .:. ::.: :. . :. . : : :. . : CCDS14 E---NDTLCWNGQELVERYSQKAARNGMKNQFNLHEL--KMKGPEPVVSQIIDKLKHI-N 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE6 KLKNAYNGNDVNFQDTSDESSGSGSGSGCMDDVCPTEFEFVTTEAPAVDPDRREVDSSAA .: ... : . . : ::. : :: CCDS14 QLLRTMSMPKGRVLDKNLDEEGFESGD-CGDDEDECIGGSGDGMIKVKNQLRFLAELAYD 480 490 500 510 520 540 550 pF1KE6 QRGHSLLSWSLTCIVLALQRLCR CCDS14 LDVDDAPGNSQQATPKDNEISTFHNLGNVHSPLKLLTSMAISVVCFFFLVH 530 540 550 560 570 580 >>CCDS55496.1 GPC3 gene_id:2719|Hs108|chrX (603 aa) initn: 567 init1: 299 opt: 569 Z-score: 677.1 bits: 135.2 E(32554): 2.1e-31 Smith-Waterman score: 656; 26.7% identity (57.5% similar) in 499 aa overlap (29-504:34-524) 10 20 30 40 50 pF1KE6 MPSWIGAVILPLLGLLLSLPAGADVKARSCGEVRQAYGAKGFSLADIPYQEIAGEHLR .: .::. . .: .: . : :. CCDS55 TVRTACLVVAMLLSLDFPGQAQPPPPPPDATCHQVRSFFQRLQPGLKWVPETPVPGSDLQ 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE6 IC-PQEYTCCTTEMEDKLSQQSKLEFENLVEETSHFVRTTFVSRHKKFDEFFRELLENAE .: :. :::. .::.: . ..:..:.:.. .: .. ... :.: :. ....:. CCDS55 VCLPKGPTCCSRKMEEKYQLTARLNMEQLLQSASMELKFLIIQNAAVFQEAFEIVVRHAK 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE6 KSLNDMFVRTYGMLYMQNSEVFQDLFTELKRYYTGGNVNLEEMLNDFWARLLERMF-QLI . : :: .: : : : ..::... : :...:...:.:... :. .. ::. CCDS55 NYTNAMFKNNYPSLTPQAFEFVGEFFTDVSLYILGSDINVDDMVNELFDSLFPVIYTQLM 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE6 NPQYHFSE-DYLECVSKYTDQLKPFGDVPRKLKIQVTRAFIAARTFVQGLTVGREVANRV :: : : ::. .:: ::. :. . ::.... ..: :.:.:..: :: : . CCDS55 NPGLPDSALDINECLRGARRDLKVFGNFPKLIMTQVSKSLQVTRIFLQALNLGIEVINTT 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE6 SKVSPTPGCIRALMKMLYCPYCRGLPTVRPCNNYCLNVMKGCLANQADLDTEWNLFIDAM .... . : : : .: :: ::.:: :.::..:: ::.::.:. ...: : .: .. CCDS55 DHLKFSKDCGRMLTRMWYCSYCQGLMMVKPCGGYCNVVMQGCMAGVVEIDKYWREYILSL 250 260 270 280 290 300 300 310 320 330 340 pF1KE6 LLVAERLEGPFNIESVMDPIDVKISEAIMNMQENSMQVSAK------------VFQGC-G ... . ...:.:. . : ..:. .:.:. .... .: : : CCDS55 EELVNGMYRIYDMENVLLGLFSTIHDSIQYVQKNAGKLTTTETEKKIWHFKYPIFFLCIG 310 320 330 340 350 360 350 360 370 380 390 pF1KE6 QPKPAPALRSARSAPENFNTRFRPYN--PEERPTTAAGTSLDRLVT----DIKEKLKLSK : :.: ... . . : . ... .: . .. .. .. .::: CCDS55 LDLQIGKL-CAHSQQRQYRSAYYPEDLFIDKKVLKVAHVEHEETLSSRRRELIQKLKSFI 370 380 390 400 410 420 400 410 420 430 440 450 pF1KE6 KVWSALPYTICKDESVTAGTSNEEECWNGHSKA-RYLPEIMNDGLTNQINNPEVDVDITR . .:::: ::. :. :. ::::. . :: . .:. ::.: :. . CCDS55 SFYSALPGYICSHSPVAE---NDTLCWNGQELVERYSQKAARNGMKNQFNLHEL--KMKG 430 440 450 460 470 460 470 480 490 500 510 pF1KE6 PDTFIRQQIMALRVMTNKLKNAYNGNDVNFQDTSDESSGSGSGSGCMDDVCPTEFEFVTT :. . : : :. . :.: ... : . . : ::. : :: CCDS55 PEPVVSQIIDKLKHI-NQLLRTMSMPKGRVLDKNLDEEGFESGD-CGDDEDECIGGSGDG 480 490 500 510 520 530 520 530 540 550 pF1KE6 EAPAVDPDRREVDSSAAQRGHSLLSWSLTCIVLALQRLCR CCDS55 MIKVKNQLRFLAELAYDLDVDDAPGNSQQATPKDNEISTFHNLGNVHSPLKLLTSMAISV 540 550 560 570 580 590 >>CCDS55495.1 GPC3 gene_id:2719|Hs108|chrX (526 aa) initn: 403 init1: 338 opt: 558 Z-score: 664.8 bits: 132.8 E(32554): 1e-30 Smith-Waterman score: 561; 28.3% identity (58.3% similar) in 403 aa overlap (107-504:59-447) 80 90 100 110 120 130 pF1KE6 QQSKLEFENLVEETSHFVRTTFVSRHKKFDEFFRELLENAEKSLNDMFVRTYGMLYMQNS : :. ....:.. : :: .: : : CCDS55 PPPDATCHQVRSFFQRLQPGLKWVPETPVPEAFEIVVRHAKNYTNAMFKNNYPSLTPQAF 30 40 50 60 70 80 140 150 160 170 180 190 pF1KE6 EVFQDLFTELKRYYTGGNVNLEEMLNDFWARLLERMF-QLINPQYHFSE-DYLECVSKYT : ..::... : :...:...:.:... :. .. ::.:: : : ::. CCDS55 EFVGEFFTDVSLYILGSDINVDDMVNELFDSLFPVIYTQLMNPGLPDSALDINECLRGAR 90 100 110 120 130 140 200 210 220 230 240 250 pF1KE6 DQLKPFGDVPRKLKIQVTRAFIAARTFVQGLTVGREVANRVSKVSPTPGCIRALMKMLYC .:: ::. :. . ::.... ..: :.:.:..: :: : ..... . : : : .: :: CCDS55 RDLKVFGNFPKLIMTQVSKSLQVTRIFLQALNLGIEVINTTDHLKFSKDCGRMLTRMWYC 150 160 170 180 190 200 260 270 280 290 300 310 pF1KE6 PYCRGLPTVRPCNNYCLNVMKGCLANQADLDTEWNLFIDAMLLVAERLEGPFNIESVMDP ::.:: :.::..:: ::.::.:. ...: : .: .. ... . ...:.:. CCDS55 SYCQGLMMVKPCGGYCNVVMQGCMAGVVEIDKYWREYILSLEELVNGMYRIYDMENVLLG 210 220 230 240 250 260 320 330 340 350 360 370 pF1KE6 IDVKISEAIMNMQENSMQVSAKVFQGCGQPKPAPALRSARSA--PENFNTRFRPYNPEER . : ..:. .:.:. .... . . :.. . :. ::: ::.. : . . CCDS55 LFSTIHDSIQYVQKNAGKLTTTIGKLCAHSQQ----RQYRSAYYPEDL---FIDKKVLKV 270 280 290 300 310 320 380 390 400 410 420 430 pF1KE6 PTTAAGTSLDRLVTDIKEKLKLSKKVWSALPYTICKDESVTAGTSNEEECWNGHSKA-RY . .:. .. .::: . .:::: ::. :. :. ::::. . :: CCDS55 AHVEHEETLSSRRRELIQKLKSFISFYSALPGYICSHSPVA---ENDTLCWNGQELVERY 330 340 350 360 370 440 450 460 470 480 490 pF1KE6 LPEIMNDGLTNQINNPEVDVDITRPDTFIRQQIMALRVMTNKLKNAYNGNDVNFQDTSDE . .:. ::.: :. . :. . : : :. :.: ... : . . CCDS55 SQKAARNGMKNQFNLHELK--MKGPEPVVSQIIDKLK-HINQLLRTMSMPKGRVLDKNLD 380 390 400 410 420 430 500 510 520 530 540 550 pF1KE6 SSGSGSGSGCMDDVCPTEFEFVTTEAPAVDPDRREVDSSAAQRGHSLLSWSLTCIVLALQ : ::. : :: CCDS55 EEGFESGD-CGDDEDECIGGSGDGMIKVKNQLRFLAELAYDLDVDDAPGNSQQATPKDNE 440 450 460 470 480 490 555 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 16:12:35 2016 done: Tue Nov 8 16:12:35 2016 Total Scan time: 2.410 Total Display time: 0.090 Function used was FASTA [36.3.4 Apr, 2011]