FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4540, 622 aa 1>>>pF1KE4540 622 - 622 aa - 622 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.2687+/-0.000862; mu= 19.4824+/- 0.052 mean_var=66.5069+/-13.346, 0's: 0 Z-trim(106.3): 18 B-trim: 4 in 1/48 Lambda= 0.157268 statistics sampled from 8915 (8922) to 8915 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.65), E-opt: 0.2 (0.274), width: 16 Scan time: 3.100 The best scores are: opt bits E(32554) CCDS13460.1 PCK1 gene_id:5105|Hs108|chr20 ( 622) 4296 983.9 0 CCDS9609.1 PCK2 gene_id:5106|Hs108|chr14 ( 640) 3189 732.7 3.5e-211 CCDS76660.1 PCK2 gene_id:5106|Hs108|chr14 ( 506) 2748 632.6 3.8e-181 CCDS41928.1 PCK2 gene_id:5106|Hs108|chr14 ( 441) 2024 468.3 9.6e-132 >>CCDS13460.1 PCK1 gene_id:5105|Hs108|chr20 (622 aa) initn: 4296 init1: 4296 opt: 4296 Z-score: 5262.5 bits: 983.9 E(32554): 0 Smith-Waterman score: 4296; 99.7% identity (100.0% similar) in 622 aa overlap (1-622:1-622) 10 20 30 40 50 60 pF1KE4 MPPQLQNGLNLSAKVVQGSLDSLPQAVREFLENNAELCQPDHIHICDGSEEENGRLLGQM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 MPPQLQNGLNLSAKVVQGSLDSLPQAVREFLENNAELCQPDHIHICDGSEEENGRLLGQM 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 EEEGILRRLKKYDNCWLALTDPRDVARIESKTVIVTQEQRDTVPIPKTGLSQLGRWMSEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 EEEGILRRLKKYDNCWLALTDPRDVARIESKTVIVTQEQRDTVPIPKTGLSQLGRWMSEE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 DFEKAFNARFPGCMKGRTMYVIPFSMGPLGSPLSKIGIELTDSPYVVASMRIMTRMGTPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 DFEKAFNARFPGCMKGRTMYVIPFSMGPLGSPLSKIGIELTDSPYVVASMRIMTRMGTPV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 LEALGDGEFVKCLHSVGCPLPLQKPLVNNWPCNPELTLIAHLPDRREIISFGSGYGGNSL :::.:::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 LEAVGDGEFVKCLHSVGCPLPLQKPLVNNWPCNPELTLIAHLPDRREIISFGSGYGGNSL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 LGKKCFALRMASRLAKEEGWLAEHMLVLGITNPEGEKKYLAAAFPSACGKTNLAMMNPSL ::::::::::::::::::::::::::.::::::::::::::::::::::::::::::::: CCDS13 LGKKCFALRMASRLAKEEGWLAEHMLILGITNPEGEKKYLAAAFPSACGKTNLAMMNPSL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 PGWKVECVGDDIAWMKFDAQGHLRAINPENGFFGVAPGTSVKTNPNAIKTIQKNTIFTNV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 PGWKVECVGDDIAWMKFDAQGHLRAINPENGFFGVAPGTSVKTNPNAIKTIQKNTIFTNV 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 AETSDGGVYWEGIDEPLASGVTITSWKNKEWSSEDGEPCAHPNSRFCTPASQCPIIDAAW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 AETSDGGVYWEGIDEPLASGVTITSWKNKEWSSEDGEPCAHPNSRFCTPASQCPIIDAAW 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 ESPEGVPIEGIIFGGRRPAGVPLVYEALSWQHGVFVGAAMRSEATAAAEHKGKIIMHDPF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 ESPEGVPIEGIIFGGRRPAGVPLVYEALSWQHGVFVGAAMRSEATAAAEHKGKIIMHDPF 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE4 AMRPFFGYNFGKYLAHWLSMAQHPAAKLPKIFHVNWFRKDKEGKFLWPGFGENSRVLEWM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 AMRPFFGYNFGKYLAHWLSMAQHPAAKLPKIFHVNWFRKDKEGKFLWPGFGENSRVLEWM 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE4 FNRIDGKASTKLTPIGYIPKEDALNLKGLGHINMMELFSISKEFWEKEVEDIEKYLEDQV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 FNRIDGKASTKLTPIGYIPKEDALNLKGLGHINMMELFSISKEFWEKEVEDIEKYLEDQV 550 560 570 580 590 600 610 620 pF1KE4 NADLPCEIEREILALKQRISQM :::::::::::::::::::::: CCDS13 NADLPCEIEREILALKQRISQM 610 620 >>CCDS9609.1 PCK2 gene_id:5106|Hs108|chr14 (640 aa) initn: 3189 init1: 2782 opt: 3189 Z-score: 3904.9 bits: 732.7 E(32554): 3.5e-211 Smith-Waterman score: 3189; 71.6% identity (89.0% similar) in 610 aa overlap (14-622:31-640) 10 20 30 40 pF1KE4 MPPQLQNGLNLSAKVVQGSLDSLPQAVREFLENNAELCQPDHI .:..:.: .:: ..:.:.:..:.::::. : CCDS96 MAALYRPGLRLNWHGLSPLGWPSCRSIQTLRVLSGDLGQLPTGIRDFVEHSARLCQPEGI 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE4 HICDGSEEENGRLLGQMEEEGILRRLKKYDNCWLALTDPRDVARIESKTVIVTQEQRDTV :::::.: :: : .:..:..:.: ::.::::: :::.::::.:::::::: ::::: CCDS96 HICDGTEAENTATLTLLEQQGLIRKLPKYNNCWLARTDPKDVARVESKTVIVTPSQRDTV 70 80 90 100 110 120 110 120 130 140 150 160 pF1KE4 PIPKTGL-SQLGRWMSEEDFEKAFNARFPGCMKGRTMYVIPFSMGPLGSPLSKIGIELTD :.: : .::: ::: ::..: . ::::::.::::::.::::::.:::::.::..::: CCDS96 PLPPGGARGQLGNWMSPADFQRAVDERFPGCMQGRTMYVLPFSMGPVGSPLSRIGVQLTD 130 140 150 160 170 180 170 180 190 200 210 220 pF1KE4 SPYVVASMRIMTRMGTPVLEALGDGEFVKCLHSVGCPLPLQKPLVNNWPCNPELTLIAHL : :::::::::::.:::::.:::::.::::::::: :: : :..:::::: :::.:. CCDS96 SAYVVASMRIMTRLGTPVLQALGDGDFVKCLHSVGQPLTGQGEPVSQWPCNPEKTLIGHV 190 200 210 220 230 240 230 240 250 260 270 280 pF1KE4 PDRREIISFGSGYGGNSLLGKKCFALRMASRLAKEEGWLAEHMLVLGITNPEGEKKYLAA ::.::::::::::::::::::::::::.:::::..:::::::::.::::.: :.:.:.:: CCDS96 PDQREIISFGSGYGGNSLLGKKCFALRIASRLARDEGWLAEHMLILGITSPAGKKRYVAA 250 260 270 280 290 300 290 300 310 320 330 340 pF1KE4 AFPSACGKTNLAMMNPSLPGWKVECVGDDIAWMKFDAQGHLRAINPENGFFGVAPGTSVK :::::::::::::: :.::::::::::::::::.::..:.::::::::::::::::::. CCDS96 AFPSACGKTNLAMMRPALPGWKVECVGDDIAWMRFDSEGRLRAINPENGFFGVAPGTSAT 310 320 330 340 350 360 350 360 370 380 390 400 pF1KE4 TNPNAIKTIQKNTIFTNVAETSDGGVYWEGIDEPLASGVTITSWKNKEWSSEDGEPCAHP :::::. :::.:::::::::::::::::::::.:: :::.::: .: :. : :::::: CCDS96 TNPNAMATIQSNTIFTNVAETSDGGVYWEGIDQPLPPGVTVTSWLGKPWKPGDKEPCAHP 370 380 390 400 410 420 410 420 430 440 450 460 pF1KE4 NSRFCTPASQCPIIDAAWESPEGVPIEGIIFGGRRPAGVPLVYEALSWQHGVFVGAAMRS :::::.:: ::::.: :::.::::::..:::::::: ::::::::..:.::::::.:::: CCDS96 NSRFCAPARQCPIMDPAWEAPEGVPIDAIIFGGRRPKGVPLVYEAFNWRHGVFVGSAMRS 430 440 450 460 470 480 470 480 490 500 510 520 pF1KE4 EATAAAEHKGKIIMHDPFAMRPFFGYNFGKYLAHWLSMAQHPAAKLPKIFHVNWFRKDKE :.:::::::::::::::::::::::::::.:: ::::: . .:.::.::::::::.:. CCDS96 ESTAAAEHKGKIIMHDPFAMRPFFGYNFGHYLEHWLSMEGRKGAQLPRIFHVNWFRRDEA 490 500 510 520 530 540 530 540 550 560 570 580 pF1KE4 GKFLWPGFGENSRVLEWMFNRIDGKASTKLTPIGYIPKEDALNLKGLGHINMMELFSISK :.:::::::::.:::.:. :..:. :.. :::: .::: ::.:.:: :. .:::. : CCDS96 GHFLWPGFGENARVLDWICRRLEGEDSARETPIGLVPKEGALDLSGLRAIDTTQLFSLPK 550 560 570 580 590 600 590 600 610 620 pF1KE4 EFWEKEVEDIEKYLEDQVNADLPCEIEREILALKQRISQM .:::.::.::..:: .::: ::: :. :. ::..:. .: CCDS96 DFWEQEVRDIRSYLTEQVNQDLPKEVLAELEALERRVHKM 610 620 630 640 >>CCDS76660.1 PCK2 gene_id:5106|Hs108|chr14 (506 aa) initn: 2778 init1: 2748 opt: 2748 Z-score: 3365.6 bits: 632.6 E(32554): 3.8e-181 Smith-Waterman score: 2748; 74.3% identity (90.3% similar) in 506 aa overlap (117-622:1-506) 90 100 110 120 130 140 pF1KE4 RIESKTVIVTQEQRDTVPIPKTGLSQLGRWMSEEDFEKAFNARFPGCMKGRTMYVIPFSM :: ::..: . ::::::.::::::.:::: CCDS76 MSPADFQRAVDERFPGCMQGRTMYVLPFSM 10 20 30 150 160 170 180 190 200 pF1KE4 GPLGSPLSKIGIELTDSPYVVASMRIMTRMGTPVLEALGDGEFVKCLHSVGCPLPLQKPL ::.:::::.::..:::: :::::::::::.:::::.:::::.::::::::: :: : CCDS76 GPVGSPLSRIGVQLTDSAYVVASMRIMTRLGTPVLQALGDGDFVKCLHSVGQPLTGQGEP 40 50 60 70 80 90 210 220 230 240 250 260 pF1KE4 VNNWPCNPELTLIAHLPDRREIISFGSGYGGNSLLGKKCFALRMASRLAKEEGWLAEHML :..:::::: :::.:.::.::::::::::::::::::::::::.:::::..::::::::: CCDS76 VSQWPCNPEKTLIGHVPDQREIISFGSGYGGNSLLGKKCFALRIASRLARDEGWLAEHML 100 110 120 130 140 150 270 280 290 300 310 320 pF1KE4 VLGITNPEGEKKYLAAAFPSACGKTNLAMMNPSLPGWKVECVGDDIAWMKFDAQGHLRAI .::::.: :.:.:.:::::::::::::::: :.::::::::::::::::.::..:.:::: CCDS76 ILGITSPAGKKRYVAAAFPSACGKTNLAMMRPALPGWKVECVGDDIAWMRFDSEGRLRAI 160 170 180 190 200 210 330 340 350 360 370 380 pF1KE4 NPENGFFGVAPGTSVKTNPNAIKTIQKNTIFTNVAETSDGGVYWEGIDEPLASGVTITSW ::::::::::::::. :::::. :::.:::::::::::::::::::::.:: :::.::: CCDS76 NPENGFFGVAPGTSATTNPNAMATIQSNTIFTNVAETSDGGVYWEGIDQPLPPGVTVTSW 220 230 240 250 260 270 390 400 410 420 430 440 pF1KE4 KNKEWSSEDGEPCAHPNSRFCTPASQCPIIDAAWESPEGVPIEGIIFGGRRPAGVPLVYE .: :. : :::::::::::.:: ::::.: :::.::::::..:::::::: ::::::: CCDS76 LGKPWKPGDKEPCAHPNSRFCAPARQCPIMDPAWEAPEGVPIDAIIFGGRRPKGVPLVYE 280 290 300 310 320 330 450 460 470 480 490 500 pF1KE4 ALSWQHGVFVGAAMRSEATAAAEHKGKIIMHDPFAMRPFFGYNFGKYLAHWLSMAQHPAA :..:.::::::.:::::.:::::::::::::::::::::::::::.:: ::::: . .: CCDS76 AFNWRHGVFVGSAMRSESTAAAEHKGKIIMHDPFAMRPFFGYNFGHYLEHWLSMEGRKGA 340 350 360 370 380 390 510 520 530 540 550 560 pF1KE4 KLPKIFHVNWFRKDKEGKFLWPGFGENSRVLEWMFNRIDGKASTKLTPIGYIPKEDALNL .::.::::::::.:. :.:::::::::.:::.:. :..:. :.. :::: .::: ::.: CCDS76 QLPRIFHVNWFRRDEAGHFLWPGFGENARVLDWICRRLEGEDSARETPIGLVPKEGALDL 400 410 420 430 440 450 570 580 590 600 610 620 pF1KE4 KGLGHINMMELFSISKEFWEKEVEDIEKYLEDQVNADLPCEIEREILALKQRISQM .:: :. .:::. :.:::.::.::..:: .::: ::: :. :. ::..:. .: CCDS76 SGLRAIDTTQLFSLPKDFWEQEVRDIRSYLTEQVNQDLPKEVLAELEALERRVHKM 460 470 480 490 500 >>CCDS41928.1 PCK2 gene_id:5106|Hs108|chr14 (441 aa) initn: 2016 init1: 1609 opt: 2024 Z-score: 2478.7 bits: 468.3 E(32554): 9.6e-132 Smith-Waterman score: 2024; 72.4% identity (88.5% similar) in 392 aa overlap (14-402:31-422) 10 20 30 40 pF1KE4 MPPQLQNGLNLSAKVVQGSLDSLPQAVREFLENNAELCQPDHI .:..:.: .:: ..:.:.:..:.::::. : CCDS41 MAALYRPGLRLNWHGLSPLGWPSCRSIQTLRVLSGDLGQLPTGIRDFVEHSARLCQPEGI 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE4 HICDGSEEENGRLLGQMEEEGILRRLKKYDNCWLALTDPRDVARIESKTVIVTQEQRDTV :::::.: :: : .:..:..:.: ::.::::: :::.::::.:::::::: ::::: CCDS41 HICDGTEAENTATLTLLEQQGLIRKLPKYNNCWLARTDPKDVARVESKTVIVTPSQRDTV 70 80 90 100 110 120 110 120 130 140 150 160 pF1KE4 PIPKTGL-SQLGRWMSEEDFEKAFNARFPGCMKGRTMYVIPFSMGPLGSPLSKIGIELTD :.: : .::: ::: ::..: . ::::::.::::::.::::::.:::::.::..::: CCDS41 PLPPGGARGQLGNWMSPADFQRAVDERFPGCMQGRTMYVLPFSMGPVGSPLSRIGVQLTD 130 140 150 160 170 180 170 180 190 200 210 220 pF1KE4 SPYVVASMRIMTRMGTPVLEALGDGEFVKCLHSVGCPLPLQKPLVNNWPCNPELTLIAHL : :::::::::::.:::::.:::::.::::::::: :: : :..:::::: :::.:. CCDS41 SAYVVASMRIMTRLGTPVLQALGDGDFVKCLHSVGQPLTGQGEPVSQWPCNPEKTLIGHV 190 200 210 220 230 240 230 240 250 260 270 280 pF1KE4 PDRREIISFGSGYGGNSLLGKKCFALRMASRLAKEEGWLAEHMLVLGITNPEGEKKYLAA ::.::::::::::::::::::::::::.:::::..:::::::::.::::.: :.:.:.:: CCDS41 PDQREIISFGSGYGGNSLLGKKCFALRIASRLARDEGWLAEHMLILGITSPAGKKRYVAA 250 260 270 280 290 300 290 300 310 320 330 340 pF1KE4 AFPSACGKTNLAMMNPSLPGWKVECVGDDIAWMKFDAQGHLRAINPENGFFGVAPGTSVK :::::::::::::: :.::::::::::::::::.::..:.::::::::::::::::::. CCDS41 AFPSACGKTNLAMMRPALPGWKVECVGDDIAWMRFDSEGRLRAINPENGFFGVAPGTSAT 310 320 330 340 350 360 350 360 370 380 390 400 pF1KE4 TNPNAIKTIQKNTIFTNVAETSDGGVYWEGIDEPLASGVTITSWKNKEWSSE--DGEPCA :::::. :::.:::::::::::::::::::::.:: :::.::: .: :. :: : CCDS41 TNPNAMATIQSNTIFTNVAETSDGGVYWEGIDQPLPPGVTVTSWLGKPWKPGMCGGEGVA 370 380 390 400 410 420 410 420 430 440 450 460 pF1KE4 HPNSRFCTPASQCPIIDAAWESPEGVPIEGIIFGGRRPAGVPLVYEALSWQHGVFVGAAM .: CCDS41 QPPGLSTLMVEKLSPQPPTIF 430 440 622 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 04:39:42 2016 done: Thu Nov 3 04:39:43 2016 Total Scan time: 3.100 Total Display time: 0.020 Function used was FASTA [36.3.4 Apr, 2011]