FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE6718, 682 aa 1>>>pF1KE6718 682 - 682 aa - 682 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.6297+/-0.00123; mu= 17.3679+/- 0.074 mean_var=60.2669+/-11.927, 0's: 0 Z-trim(100.0): 25 B-trim: 0 in 0/49 Lambda= 0.165209 statistics sampled from 5922 (5929) to 5922 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.527), E-opt: 0.2 (0.182), width: 16 Scan time: 2.130 The best scores are: opt bits E(32554) CCDS43411.1 GFPT2 gene_id:9945|Hs108|chr5 ( 682) 4416 1061.8 0 CCDS33216.1 GFPT1 gene_id:2673|Hs108|chr2 ( 681) 3637 876.1 0 CCDS58713.1 GFPT1 gene_id:2673|Hs108|chr2 ( 699) 2442 591.3 1.6e-168 >>CCDS43411.1 GFPT2 gene_id:9945|Hs108|chr5 (682 aa) initn: 4416 init1: 4416 opt: 4416 Z-score: 5682.0 bits: 1061.8 E(32554): 0 Smith-Waterman score: 4416; 99.9% identity (100.0% similar) in 682 aa overlap (1-682:1-682) 10 20 30 40 50 60 pF1KE6 MCGIFAYMNYRVPRTRKEIFETLIKGLQRLEYRGYDSAGVAIDGNNHEVKERHIQLVKKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 MCGIFAYMNYRVPRTRKEIFETLIKGLQRLEYRGYDSAGVAIDGNNHEVKERHIQLVKKR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 GKVKALDEELYKQDSMDLKVEFETHFGIAHTRWATHGVPSAVNSHPQRSDKGNEFVVIHN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 GKVKALDEELYKQDSMDLKVEFETHFGIAHTRWATHGVPSAVNSHPQRSDKGNEFVVIHN 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 GIITNYKDLRKFLESKGYEFESETDTETIAKLIKYVFDNRETEDITFSTLVERVIQQLEG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 GIITNYKDLRKFLESKGYEFESETDTETIAKLIKYVFDNRETEDITFSTLVERVIQQLEG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 AFALVFKSVHYPGEAVATRRGSPLLIGVRSKYKLSTEQIPILYRTCTLENVKNICKTRMK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 AFALVFKSVHYPGEAVATRRGSPLLIGVRSKYKLSTEQIPILYRTCTLENVKNICKTRMK 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE6 RLDSSACLHAVGDKAVEFFFASDASAIIEHTNRVIFLEDDDIAAVADGKLSIHRVKRSAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 RLDSSACLHAVGDKAVEFFFASDASAIIEHTNRVIFLEDDDIAAVADGKLSIHRVKRSAS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE6 DDPSRAIQTLQMELQQIMKGNFSAFMQKEIFEQPESVFNTMRGRVNFETNTVLLGGLKDH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 DDPSRAIQTLQMELQQIMKGNFSAFMQKEIFEQPESVFNTMRGRVNFETNTVLLGGLKDH 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE6 LKEIRRCRRLIVIGCGTSYHAAVATRQVLEELTELPVMVELASDFLDRNTPVFRDDVCFF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 LKEIRRCRRLIVIGCGTSYHAAVATRQVLEELTELPVMVELASDFLDRNTPVFRDDVCFF 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE6 ISQSGETADTLLALRYCKDRGALTVGVTNTVGSSISRETDCGVHINAGPEVGVASTKAYT ::::::::::::::::::::::::::::::::::::::::::::::::::.::::::::: CCDS43 ISQSGETADTLLALRYCKDRGALTVGVTNTVGSSISRETDCGVHINAGPEIGVASTKAYT 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE6 SQFISLVMFGLMMSEDRISLQNRRQEIIRGLRSLPELIKEVLSLEEKIHDLALELYTQRS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SQFISLVMFGLMMSEDRISLQNRRQEIIRGLRSLPELIKEVLSLEEKIHDLALELYTQRS 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE6 LLVMGRGYNYATCLEGALKIKEITYMHSEGILAGELKHGPLALIDKQMPVIMVIMKDPCF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 LLVMGRGYNYATCLEGALKIKEITYMHSEGILAGELKHGPLALIDKQMPVIMVIMKDPCF 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE6 AKCQNALQQVTARQGRPIILCSKDDTESSKFAYKTIELPHTVDCLQGILSVIPLQLLSFH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 AKCQNALQQVTARQGRPIILCSKDDTESSKFAYKTIELPHTVDCLQGILSVIPLQLLSFH 610 620 630 640 650 660 670 680 pF1KE6 LAVLRGYDVDFPRNLAKSVTVE :::::::::::::::::::::: CCDS43 LAVLRGYDVDFPRNLAKSVTVE 670 680 >>CCDS33216.1 GFPT1 gene_id:2673|Hs108|chr2 (681 aa) initn: 3640 init1: 2440 opt: 3637 Z-score: 4678.5 bits: 876.1 E(32554): 0 Smith-Waterman score: 3637; 79.0% identity (94.6% similar) in 685 aa overlap (1-682:1-681) 10 20 30 40 50 pF1KE6 MCGIFAYMNYRVPRTRKEIFETLIKGLQRLEYRGYDSAGVAIDGNNH---EVKERHIQLV :::::::.::.:::::.::.::::::::::::::::::::..::.: :.. .:::. CCDS33 MCGIFAYLNYHVPRTRREILETLIKGLQRLEYRGYDSAGVGFDGGNDKDWEANACKIQLI 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE6 KKRGKVKALDEELYKQDSMDLKVEFETHFGIAHTRWATHGVPSAVNSHPQRSDKGNEFVV ::.:::::::::..::..::: .::..:.::::::::::: :: ::::::::::.:::.: CCDS33 KKKGKVKALDEEVHKQQDMDLDIEFDVHLGIAHTRWATHGEPSPVNSHPQRSDKNNEFIV 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE6 IHNGIITNYKDLRKFLESKGYEFESETDTETIAKLIKYVFDNRETEDITFSTLVERVIQQ ::::::::::::.::::::::.:::::::::::::.::..::::..: .:.::::::::: CCDS33 IHNGIITNYKDLKKFLESKGYDFESETDTETIAKLVKYMYDNRESQDTSFTTLVERVIQQ 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE6 LEGAFALVFKSVHYPGEAVATRRGSPLLIGVRSKYKLSTEQIPILYRTCTLENVKNICKT :::::::::::::.::.::.:::::::::::::..::::..::::::: .. :. :. CCDS33 LEGAFALVFKSVHFPGQAVGTRRGSPLLIGVRSEHKLSTDHIPILYRTG--KDKKGSCN- 190 200 210 220 230 240 250 260 270 280 290 pF1KE6 RMKRLDSSACLHAVGDKAVEFFFASDASAIIEHTNRVIFLEDDDIAAVADGKLSIHRVKR ..:.::..:: : .::::..:::::::.::::::::::::::.:::.::.:::::.:: CCDS33 -LSRVDSTTCLFPVEEKAVEYYFASDASAVIEHTNRVIFLEDDDVAAVVDGRLSIHRIKR 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE6 SASDDPSRAIQTLQMELQQIMKGNFSAFMQKEIFEQPESVFNTMRGRVNFETNTVLLGGL .:.: :.::.::::::::::::::::.::::::::::::: :::::::::. :: :::: CCDS33 TAGDHPGRAVQTLQMELQQIMKGNFSSFMQKEIFEQPESVVNTMRGRVNFDDYTVNLGGL 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE6 KDHLKEIRRCRRLIVIGCGTSYHAAVATRQVLEELTELPVMVELASDFLDRNTPVFRDDV :::.:::.::::::.:.:::::::.::::::::::::::::::::::::::::::::::: CCDS33 KDHIKEIQRCRRLILIACGTSYHAGVATRQVLEELTELPVMVELASDFLDRNTPVFRDDV 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE6 CFFISQSGETADTLLALRYCKDRGALTVGVTNTVGSSISRETDCGVHINAGPEVGVASTK :::.::::::::::..:::::.:::::::.:::::::::::::::::::::::.:::::: CCDS33 CFFLSQSGETADTLMGLRYCKERGALTVGITNTVGSSISRETDCGVHINAGPEIGVASTK 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE6 AYTSQFISLVMFGLMMSEDRISLQNRRQEIIRGLRSLPELIKEVLSLEEKIHDLALELYT ::::::.:::::.::: .::::.:.::.::. ::. ::.:::::::....:. :: ::: CCDS33 AYTSQFVSLVMFALMMCDDRISMQERRKEIMLGLKRLPDLIKEVLSMDDEIQKLATELYH 480 490 500 510 520 530 540 550 560 570 580 590 pF1KE6 QRSLLVMGRGYNYATCLEGALKIKEITYMHSEGILAGELKHGPLALIDKQMPVIMVIMKD :.:.:.:::::.::::::::::::::::::::::::::::::::::.:: :::::.::.: CCDS33 QKSVLIMGRGYHYATCLEGALKIKEITYMHSEGILAGELKHGPLALVDKLMPVIMIIMRD 540 550 560 570 580 590 600 610 620 630 640 650 pF1KE6 PCFAKCQNALQQVTARQGRPIILCSKDDTESSKFAYKTIELPHTVDCLQGILSVIPLQLL .::::::::::.::::::...:.:.:::. : . .::..::.:::::::::::::::: CCDS33 HTYAKCQNALQQVVARQGRPVVICDKEDTETIKNTKRTIKVPHSVDCLQGILSVIPLQLL 600 610 620 630 640 650 660 670 680 pF1KE6 SFHLAVLRGYDVDFPRNLAKSVTVE .:::::::::::::::::::::::: CCDS33 AFHLAVLRGYDVDFPRNLAKSVTVE 660 670 680 >>CCDS58713.1 GFPT1 gene_id:2673|Hs108|chr2 (699 aa) initn: 3640 init1: 2440 opt: 2442 Z-score: 3139.0 bits: 591.3 E(32554): 1.6e-168 Smith-Waterman score: 3610; 77.2% identity (92.4% similar) in 701 aa overlap (1-682:1-699) 10 20 30 40 50 pF1KE6 MCGIFAYMNYRVPRTRKEIFETLIKGLQRLEYRGYDSAGVAIDGNNH---EVKERHIQLV :::::::.::.:::::.::.::::::::::::::::::::..::.: :.. .:::. CCDS58 MCGIFAYLNYHVPRTRREILETLIKGLQRLEYRGYDSAGVGFDGGNDKDWEANACKIQLI 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE6 KKRGKVKALDEELYKQDSMDLKVEFETHFGIAHTRWATHGVPSAVNSHPQRSDKGNEFVV ::.:::::::::..::..::: .::..:.::::::::::: :: ::::::::::.:::.: CCDS58 KKKGKVKALDEEVHKQQDMDLDIEFDVHLGIAHTRWATHGEPSPVNSHPQRSDKNNEFIV 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE6 IHNGIITNYKDLRKFLESKGYEFESETDTETIAKLIKYVFDNRETEDITFSTLVERVIQQ ::::::::::::.::::::::.:::::::::::::.::..::::..: .:.::::::::: CCDS58 IHNGIITNYKDLKKFLESKGYDFESETDTETIAKLVKYMYDNRESQDTSFTTLVERVIQQ 130 140 150 160 170 180 180 190 200 210 220 pF1KE6 LEGAFALVFKSVHYPGEAVATRRGSPLLIGVRSKYKLSTEQIPILYRTCTLE-------- :::::::::::::.::.::.:::::::::::::..::::..::::::: . CCDS58 LEGAFALVFKSVHFPGQAVGTRRGSPLLIGVRSEHKLSTDHIPILYRTARTQIGSKFTRW 190 200 210 220 230 240 230 240 250 260 270 280 pF1KE6 --------NVKNICKTRMKRLDSSACLHAVGDKAVEFFFASDASAIIEHTNRVIFLEDDD . :. :. ..:.::..:: : .::::..:::::::.:::::::::::::: CCDS58 GSQGERGKDKKGSCN--LSRVDSTTCLFPVEEKAVEYYFASDASAVIEHTNRVIFLEDDD 250 260 270 280 290 290 300 310 320 330 340 pF1KE6 IAAVADGKLSIHRVKRSASDDPSRAIQTLQMELQQIMKGNFSAFMQKEIFEQPESVFNTM .:::.::.:::::.::.:.: :.::.::::::::::::::::.::::::::::::: ::: CCDS58 VAAVVDGRLSIHRIKRTAGDHPGRAVQTLQMELQQIMKGNFSSFMQKEIFEQPESVVNTM 300 310 320 330 340 350 350 360 370 380 390 400 pF1KE6 RGRVNFETNTVLLGGLKDHLKEIRRCRRLIVIGCGTSYHAAVATRQVLEELTELPVMVEL ::::::. :: :::::::.:::.::::::.:.:::::::.::::::::::::::::::: CCDS58 RGRVNFDDYTVNLGGLKDHIKEIQRCRRLILIACGTSYHAGVATRQVLEELTELPVMVEL 360 370 380 390 400 410 410 420 430 440 450 460 pF1KE6 ASDFLDRNTPVFRDDVCFFISQSGETADTLLALRYCKDRGALTVGVTNTVGSSISRETDC :::::::::::::::::::.::::::::::..:::::.:::::::.:::::::::::::: CCDS58 ASDFLDRNTPVFRDDVCFFLSQSGETADTLMGLRYCKERGALTVGITNTVGSSISRETDC 420 430 440 450 460 470 470 480 490 500 510 520 pF1KE6 GVHINAGPEVGVASTKAYTSQFISLVMFGLMMSEDRISLQNRRQEIIRGLRSLPELIKEV :::::::::.::::::::::::.:::::.::: .::::.:.::.::. ::. ::.::::: CCDS58 GVHINAGPEIGVASTKAYTSQFVSLVMFALMMCDDRISMQERRKEIMLGLKRLPDLIKEV 480 490 500 510 520 530 530 540 550 560 570 580 pF1KE6 LSLEEKIHDLALELYTQRSLLVMGRGYNYATCLEGALKIKEITYMHSEGILAGELKHGPL ::....:. :: ::: :.:.:.:::::.:::::::::::::::::::::::::::::::: CCDS58 LSMDDEIQKLATELYHQKSVLIMGRGYHYATCLEGALKIKEITYMHSEGILAGELKHGPL 540 550 560 570 580 590 590 600 610 620 630 640 pF1KE6 ALIDKQMPVIMVIMKDPCFAKCQNALQQVTARQGRPIILCSKDDTESSKFAYKTIELPHT ::.:: :::::.::.: .::::::::::.::::::...:.:.:::. : . .::..::. CCDS58 ALVDKLMPVIMIIMRDHTYAKCQNALQQVVARQGRPVVICDKEDTETIKNTKRTIKVPHS 600 610 620 630 640 650 650 660 670 680 pF1KE6 VDCLQGILSVIPLQLLSFHLAVLRGYDVDFPRNLAKSVTVE ::::::::::::::::.:::::::::::::::::::::::: CCDS58 VDCLQGILSVIPLQLLAFHLAVLRGYDVDFPRNLAKSVTVE 660 670 680 690 682 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 15:40:58 2016 done: Tue Nov 8 15:40:58 2016 Total Scan time: 2.130 Total Display time: 0.020 Function used was FASTA [36.3.4 Apr, 2011]