FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB0441, 444 aa 1>>>pF1KB0441 444 - 444 aa - 444 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.2519+/-0.000952; mu= 17.3110+/- 0.057 mean_var=59.1379+/-11.704, 0's: 0 Z-trim(103.9): 24 B-trim: 0 in 0/47 Lambda= 0.166779 statistics sampled from 7643 (7650) to 7643 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.604), E-opt: 0.2 (0.235), width: 16 Scan time: 2.940 The best scores are: opt bits E(32554) CCDS11197.1 SHMT1 gene_id:6470|Hs108|chr17 ( 444) 2950 718.4 3.4e-207 CCDS11196.1 SHMT1 gene_id:6470|Hs108|chr17 ( 483) 1846 452.8 3.4e-127 CCDS53805.1 SHMT2 gene_id:6472|Hs108|chr12 ( 483) 1256 310.9 1.8e-84 CCDS8934.1 SHMT2 gene_id:6472|Hs108|chr12 ( 504) 1256 310.9 1.9e-84 CCDS62112.1 SHMT1 gene_id:6470|Hs108|chr17 ( 345) 1117 277.4 1.6e-74 CCDS55837.1 SHMT2 gene_id:6472|Hs108|chr12 ( 494) 804 202.1 1e-51 >>CCDS11197.1 SHMT1 gene_id:6470|Hs108|chr17 (444 aa) initn: 2950 init1: 2950 opt: 2950 Z-score: 3833.2 bits: 718.4 E(32554): 3.4e-207 Smith-Waterman score: 2950; 100.0% identity (100.0% similar) in 444 aa overlap (1-444:1-444) 10 20 30 40 50 60 pF1KB0 MTMPVNGAHKDADLWSSHDKMLAQPLKDSDVEVYNIIKKESNRQRVGLELIASENFASRA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 MTMPVNGAHKDADLWSSHDKMLAQPLKDSDVEVYNIIKKESNRQRVGLELIASENFASRA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB0 VLEALGSCLNNKYSEGYPGQRYYGGTEFIDELETLCQKRALQAYKLDPQCWGVNVQPYSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 VLEALGSCLNNKYSEGYPGQRYYGGTEFIDELETLCQKRALQAYKLDPQCWGVNVQPYSG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB0 SPANFAVYTALVEPHGRIMGLDLPDGGHLTHGFMTDKKKISATSIFFESMPYKVNPDTGY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 SPANFAVYTALVEPHGRIMGLDLPDGGHLTHGFMTDKKKISATSIFFESMPYKVNPDTGY 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB0 INYDQLEENARLFHPKLIIAGTSCYSRNLEYARLRKIADENGAYLMADMAHISGLVAAGV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 INYDQLEENARLFHPKLIIAGTSCYSRNLEYARLRKIADENGAYLMADMAHISGLVAAGV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB0 VPSPFEHCHVVTTTTHKTLRGCRAGMIFYRKGVAVALKQAMTLEFKVYQHQVVANCRALS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 VPSPFEHCHVVTTTTHKTLRGCRAGMIFYRKGVAVALKQAMTLEFKVYQHQVVANCRALS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB0 EALTELGYKIVTGGSDNHLILVDLRSKGTDGGRAEKVLEACSIACNKNTCPGDRSALRPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 EALTELGYKIVTGGSDNHLILVDLRSKGTDGGRAEKVLEACSIACNKNTCPGDRSALRPS 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB0 GLRLGTPALTSRGLLEKDFQKVAHFIHRGIELTLQIQSDTGVRATLKEFKERLAGDKYQA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 GLRLGTPALTSRGLLEKDFQKVAHFIHRGIELTLQIQSDTGVRATLKEFKERLAGDKYQA 370 380 390 400 410 420 430 440 pF1KB0 AVQALREEVESFASLFPLPGLPDF :::::::::::::::::::::::: CCDS11 AVQALREEVESFASLFPLPGLPDF 430 440 >>CCDS11196.1 SHMT1 gene_id:6470|Hs108|chr17 (483 aa) initn: 1846 init1: 1846 opt: 1846 Z-score: 2397.1 bits: 452.8 E(32554): 3.4e-127 Smith-Waterman score: 2808; 91.8% identity (91.8% similar) in 476 aa overlap (1-437:1-476) 10 20 30 40 50 60 pF1KB0 MTMPVNGAHKDADLWSSHDKMLAQPLKDSDVEVYNIIKKESNRQRVGLELIASENFASRA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 MTMPVNGAHKDADLWSSHDKMLAQPLKDSDVEVYNIIKKESNRQRVGLELIASENFASRA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB0 VLEALGSCLNNKYSEGYPGQRYYGGTEFIDELETLCQKRALQAYKLDPQCWGVNVQPYSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 VLEALGSCLNNKYSEGYPGQRYYGGTEFIDELETLCQKRALQAYKLDPQCWGVNVQPYSG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB0 SPANFAVYTALVEPHGRIMGLDLPDGGHLTHGFMTDKKKISATSIFFESMPYKVNPDTGY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 SPANFAVYTALVEPHGRIMGLDLPDGGHLTHGFMTDKKKISATSIFFESMPYKVNPDTGY 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB0 INYDQLEENARLFHPKLIIAGTSCYSRNLEYARLRKIADENGAYLMADMAHISGLVAAGV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 INYDQLEENARLFHPKLIIAGTSCYSRNLEYARLRKIADENGAYLMADMAHISGLVAAGV 190 200 210 220 230 240 250 260 270 pF1KB0 VPSPFEHCHVVTTTTHKTLRGCRAGMIFYRKGV--------------------------- ::::::::::::::::::::::::::::::::: CCDS11 VPSPFEHCHVVTTTTHKTLRGCRAGMIFYRKGVKSVDPKTGKEILYNLESLINSAVFPGL 250 260 270 280 290 300 280 290 300 310 320 pF1KB0 ------------AVALKQAMTLEFKVYQHQVVANCRALSEALTELGYKIVTGGSDNHLIL :::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 QGGPHNHAIAGVAVALKQAMTLEFKVYQHQVVANCRALSEALTELGYKIVTGGSDNHLIL 310 320 330 340 350 360 330 340 350 360 370 380 pF1KB0 VDLRSKGTDGGRAEKVLEACSIACNKNTCPGDRSALRPSGLRLGTPALTSRGLLEKDFQK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 VDLRSKGTDGGRAEKVLEACSIACNKNTCPGDRSALRPSGLRLGTPALTSRGLLEKDFQK 370 380 390 400 410 420 390 400 410 420 430 440 pF1KB0 VAHFIHRGIELTLQIQSDTGVRATLKEFKERLAGDKYQAAVQALREEVESFASLFPLPGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS11 VAHFIHRGIELTLQIQSDTGVRATLKEFKERLAGDKYQAAVQALREEVESFASLFPLPGL 430 440 450 460 470 480 pF1KB0 PDF CCDS11 PDF >>CCDS53805.1 SHMT2 gene_id:6472|Hs108|chr12 (483 aa) initn: 1816 init1: 1256 opt: 1256 Z-score: 1629.8 bits: 310.9 E(32554): 1.8e-84 Smith-Waterman score: 1742; 60.1% identity (77.6% similar) in 456 aa overlap (24-439:26-478) 10 20 30 40 50 pF1KB0 MTMPVNGAHKDADLWSSHDKMLAQPLKDSDVEVYNIIKKESNRQRVGLELIASENFAS . :.::: :.......:..:: :::::::::: : CCDS53 MAIRAQHSNAAQTQTGEANRGWTGQESLSDSDPEMWELLQREKDRQCRGLELIASENFCS 10 20 30 40 50 60 60 70 80 90 100 110 pF1KB0 RAVLEALGSCLNNKYSEGYPGQRYYGGTEFIDELETLCQKRALQAYKLDPQCWGVNVQPY ::.::::::::::::::::::.:::::.: .::.: :::.:::.:. ::: :::::::: CCDS53 RAALEALGSCLNNKYSEGYPGKRYYGGAEVVDEIELLCQRRALEAFDLDPAQWGVNVQPY 70 80 90 100 110 120 120 130 140 150 160 170 pF1KB0 SGSPANFAVYTALVEPHGRIMGLDLPDGGHLTHGFMTDKKKISATSIFFESMPYKVNPDT ::::::.::::::..:: ::::::::::::::::.:.: :.::::::::::::::.:: : CCDS53 SGSPANLAVYTALLQPHDRIMGLDLPDGGHLTHGYMSDVKRISATSIFFESMPYKLNPKT 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB0 GYINYDQLEENARLFHPKLIIAGTSCYSRNLEYARLRKIADENGAYLMADMAHISGLVAA : :.:.:: .::::.:.::::::: :.: ..:::.:.. :: :.:.:::::::::::: CCDS53 GLIDYNQLALTARLFRPRLIIAGTSAYARLIDYARMREVCDEVKAHLLADMAHISGLVAA 190 200 210 220 230 240 240 250 260 270 pF1KB0 GVVPSPFEHCHVVTTTTHKTLRGCRAGMIFYRKGV------------------------- :.::::.: .::::::::::: :.:.::::::: CCDS53 KVIPSPFKHADIVTTTTHKTLRGARSGLIFYRKGVKAVDPKTGREIPYTFEDRINFAVFP 250 260 270 280 290 300 280 290 300 310 pF1KB0 --------------AVALKQAMTLEFKVYQHQVVANCRALSEALTELGYKIVTGGSDNHL ::::::: : :. :. ::. : ::...:: : ::..:.::.:::: CCDS53 SLQGGPHNHAIAAVAVALKQACTPMFREYSLQVLKNARAMADALLERGYSLVSGGTDNHL 310 320 330 340 350 360 320 330 340 350 360 370 pF1KB0 ILVDLRSKGTDGGRAEKVLEACSIACNKNTCPGDRSALRPSGLRLGTPALTSRGLLEKDF .::::: :: ::.:::.::: ::. :::::::::::. :.:::::.:::::: . : :: CCDS53 VLVDLRPKGLDGARAERVLELVSITANKNTCPGDRSAITPGGLRLGAPALTSRQFREDDF 370 380 390 400 410 420 380 390 400 410 420 430 pF1KB0 QKVAHFIHRGIELTLQIQSDTGVRATLKEFKERLAGDKYQAAVQA-LREEVESFASLFPL ..:. :: .:... :...: : : :..:: : :. . : ::..::.:: ::. CCDS53 RRVVDFIDEGVNIGLEVKSKT---AKLQDFKSFLLKDSETSQRLANLRQRVEQFARAFPM 430 440 450 460 470 440 pF1KB0 PGLPDF : CCDS53 PGFDEH 480 >>CCDS8934.1 SHMT2 gene_id:6472|Hs108|chr12 (504 aa) initn: 1816 init1: 1256 opt: 1256 Z-score: 1629.5 bits: 310.9 E(32554): 1.9e-84 Smith-Waterman score: 1742; 60.1% identity (77.6% similar) in 456 aa overlap (24-439:47-499) 10 20 30 40 50 pF1KB0 MTMPVNGAHKDADLWSSHDKMLAQPLKDSDVEVYNIIKKESNRQRVGLELIAS . :.::: :.......:..:: ::::::: CCDS89 GQLVRMAIRAQHSNAAQTQTGEANRGWTGQESLSDSDPEMWELLQREKDRQCRGLELIAS 20 30 40 50 60 70 60 70 80 90 100 110 pF1KB0 ENFASRAVLEALGSCLNNKYSEGYPGQRYYGGTEFIDELETLCQKRALQAYKLDPQCWGV ::: :::.::::::::::::::::::.:::::.: .::.: :::.:::.:. ::: ::: CCDS89 ENFCSRAALEALGSCLNNKYSEGYPGKRYYGGAEVVDEIELLCQRRALEAFDLDPAQWGV 80 90 100 110 120 130 120 130 140 150 160 170 pF1KB0 NVQPYSGSPANFAVYTALVEPHGRIMGLDLPDGGHLTHGFMTDKKKISATSIFFESMPYK :::::::::::.::::::..:: ::::::::::::::::.:.: :.:::::::::::::: CCDS89 NVQPYSGSPANLAVYTALLQPHDRIMGLDLPDGGHLTHGYMSDVKRISATSIFFESMPYK 140 150 160 170 180 190 180 190 200 210 220 230 pF1KB0 VNPDTGYINYDQLEENARLFHPKLIIAGTSCYSRNLEYARLRKIADENGAYLMADMAHIS .:: :: :.:.:: .::::.:.::::::: :.: ..:::.:.. :: :.:.::::::: CCDS89 LNPKTGLIDYNQLALTARLFRPRLIIAGTSAYARLIDYARMREVCDEVKAHLLADMAHIS 200 210 220 230 240 250 240 250 260 270 pF1KB0 GLVAAGVVPSPFEHCHVVTTTTHKTLRGCRAGMIFYRKGV-------------------- ::::: :.::::.: .::::::::::: :.:.::::::: CCDS89 GLVAAKVIPSPFKHADIVTTTTHKTLRGARSGLIFYRKGVKAVDPKTGREIPYTFEDRIN 260 270 280 290 300 310 280 290 300 310 pF1KB0 -------------------AVALKQAMTLEFKVYQHQVVANCRALSEALTELGYKIVTGG ::::::: : :. :. ::. : ::...:: : ::..:.:: CCDS89 FAVFPSLQGGPHNHAIAAVAVALKQACTPMFREYSLQVLKNARAMADALLERGYSLVSGG 320 330 340 350 360 370 320 330 340 350 360 370 pF1KB0 SDNHLILVDLRSKGTDGGRAEKVLEACSIACNKNTCPGDRSALRPSGLRLGTPALTSRGL .::::.::::: :: ::.:::.::: ::. :::::::::::. :.:::::.:::::: . CCDS89 TDNHLVLVDLRPKGLDGARAERVLELVSITANKNTCPGDRSAITPGGLRLGAPALTSRQF 380 390 400 410 420 430 380 390 400 410 420 430 pF1KB0 LEKDFQKVAHFIHRGIELTLQIQSDTGVRATLKEFKERLAGDKYQAAVQA-LREEVESFA : ::..:. :: .:... :...: : : :..:: : :. . : ::..::.:: CCDS89 REDDFRRVVDFIDEGVNIGLEVKSKT---AKLQDFKSFLLKDSETSQRLANLRQRVEQFA 440 450 460 470 480 490 440 pF1KB0 SLFPLPGLPDF ::.: CCDS89 RAFPMPGFDEH 500 >>CCDS62112.1 SHMT1 gene_id:6470|Hs108|chr17 (345 aa) initn: 1117 init1: 1117 opt: 1117 Z-score: 1451.4 bits: 277.4 E(32554): 1.6e-74 Smith-Waterman score: 1928; 88.7% identity (88.7% similar) in 345 aa overlap (139-444:1-345) 110 120 130 140 150 160 pF1KB0 QCWGVNVQPYSGSPANFAVYTALVEPHGRIMGLDLPDGGHLTHGFMTDKKKISATSIFFE :::::::::::::::::::::::::::::: CCDS62 MGLDLPDGGHLTHGFMTDKKKISATSIFFE 10 20 30 170 180 190 200 210 220 pF1KB0 SMPYKVNPDTGYINYDQLEENARLFHPKLIIAGTSCYSRNLEYARLRKIADENGAYLMAD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 SMPYKVNPDTGYINYDQLEENARLFHPKLIIAGTSCYSRNLEYARLRKIADENGAYLMAD 40 50 60 70 80 90 230 240 250 260 270 pF1KB0 MAHISGLVAAGVVPSPFEHCHVVTTTTHKTLRGCRAGMIFYRKGV--------------- ::::::::::::::::::::::::::::::::::::::::::::: CCDS62 MAHISGLVAAGVVPSPFEHCHVVTTTTHKTLRGCRAGMIFYRKGVKSVDPKTGKEILYNL 100 110 120 130 140 150 280 290 300 pF1KB0 ------------------------AVALKQAMTLEFKVYQHQVVANCRALSEALTELGYK :::::::::::::::::::::::::::::::::::: CCDS62 ESLINSAVFPGLQGGPHNHAIAGVAVALKQAMTLEFKVYQHQVVANCRALSEALTELGYK 160 170 180 190 200 210 310 320 330 340 350 360 pF1KB0 IVTGGSDNHLILVDLRSKGTDGGRAEKVLEACSIACNKNTCPGDRSALRPSGLRLGTPAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 IVTGGSDNHLILVDLRSKGTDGGRAEKVLEACSIACNKNTCPGDRSALRPSGLRLGTPAL 220 230 240 250 260 270 370 380 390 400 410 420 pF1KB0 TSRGLLEKDFQKVAHFIHRGIELTLQIQSDTGVRATLKEFKERLAGDKYQAAVQALREEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 TSRGLLEKDFQKVAHFIHRGIELTLQIQSDTGVRATLKEFKERLAGDKYQAAVQALREEV 280 290 300 310 320 330 430 440 pF1KB0 ESFASLFPLPGLPDF ::::::::::::::: CCDS62 ESFASLFPLPGLPDF 340 >>CCDS55837.1 SHMT2 gene_id:6472|Hs108|chr12 (494 aa) initn: 1751 init1: 798 opt: 804 Z-score: 1041.9 bits: 202.1 E(32554): 1e-51 Smith-Waterman score: 1677; 58.5% identity (75.9% similar) in 460 aa overlap (24-443:47-493) 10 20 30 40 50 pF1KB0 MTMPVNGAHKDADLWSSHDKMLAQPLKDSDVEVYNIIKKESNRQRVGLELIAS . :.::: :.......:..:: ::::::: CCDS55 GQLVRMAIRAQHSNAAQTQTGEANRGWTGQESLSDSDPEMWELLQREKDRQCRGLELIAS 20 30 40 50 60 70 60 70 80 90 100 110 pF1KB0 ENFASRAVLEALGSCLNNKYSEGYPGQRYYGGTEFIDELETLCQKRALQAYKLDPQCWGV ::: :::.::::::::::::::::::.:::::.: .::.: :::.:::.:. ::: ::: CCDS55 ENFCSRAALEALGSCLNNKYSEGYPGKRYYGGAEVVDEIELLCQRRALEAFDLDPAQWGV 80 90 100 110 120 130 120 130 140 150 160 170 pF1KB0 NVQPYSGSPANFAVYTALVEPHGRIMGLDLPDGGHLTHGFMTDKKKISATSIFFESMPYK :::::::::::.::::::..:: ::::::::::::::::.:.: :.:::::::::::::: CCDS55 NVQPYSGSPANLAVYTALLQPHDRIMGLDLPDGGHLTHGYMSDVKRISATSIFFESMPYK 140 150 160 170 180 190 180 190 200 210 220 230 pF1KB0 VNPDTGYINYDQLEENARLFHPKLIIAGTSCYSRNLEYARLRKIADENGAYLMADMAHIS .: : .::::.:.::::::: :.: ..:::.:.. :: :.:.::::::: CCDS55 LN----------LALTARLFRPRLIIAGTSAYARLIDYARMREVCDEVKAHLLADMAHIS 200 210 220 230 240 240 250 260 270 pF1KB0 GLVAAGVVPSPFEHCHVVTTTTHKTLRGCRAGMIFYRKGV-------------------- ::::: :.::::.: .::::::::::: :.:.::::::: CCDS55 GLVAAKVIPSPFKHADIVTTTTHKTLRGARSGLIFYRKGVKAVDPKTGREIPYTFEDRIN 250 260 270 280 290 300 280 290 300 310 pF1KB0 -------------------AVALKQAMTLEFKVYQHQVVANCRALSEALTELGYKIVTGG ::::::: : :. :. ::. : ::...:: : ::..:.:: CCDS55 FAVFPSLQGGPHNHAIAAVAVALKQACTPMFREYSLQVLKNARAMADALLERGYSLVSGG 310 320 330 340 350 360 320 330 340 350 360 370 pF1KB0 SDNHLILVDLRSKGTDGGRAEKVLEACSIACNKNTCPGDRSALRPSGLRLGTPALTSRGL .::::.::::: :: ::.:::.::: ::. :::::::::::. :.:::::.:::::: . CCDS55 TDNHLVLVDLRPKGLDGARAERVLELVSITANKNTCPGDRSAITPGGLRLGAPALTSRQF 370 380 390 400 410 420 380 390 400 410 420 430 pF1KB0 LEKDFQKVAHFIHRGIELTLQIQSDTGVRATLKEFKERLAGDKYQAAVQA-LREEVESFA : ::..:. :: .:... :...: : : :..:: : :. . : ::..::.:: CCDS55 REDDFRRVVDFIDEGVNIGLEVKSKT---AKLQDFKSFLLKDSETSQRLANLRQRVEQFA 430 440 450 460 470 480 440 pF1KB0 SLFPLPGLPDF ::.::. . CCDS55 RAFPMPGFDEH 490 444 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 16:52:37 2016 done: Sat Nov 5 16:52:38 2016 Total Scan time: 2.940 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]