FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE3323, 917 aa 1>>>pF1KE3323 917 - 917 aa - 917 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.0408+/- 0.001; mu= 8.1131+/- 0.061 mean_var=253.1303+/-52.275, 0's: 0 Z-trim(113.3): 7 B-trim: 360 in 1/52 Lambda= 0.080612 statistics sampled from 13951 (13955) to 13951 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.733), E-opt: 0.2 (0.429), width: 16 Scan time: 4.950 The best scores are: opt bits E(32554) CCDS13619.1 PAXBP1 gene_id:94104|Hs108|chr21 ( 917) 6057 718.0 1.9e-206 CCDS33541.1 PAXBP1 gene_id:94104|Hs108|chr21 ( 815) 5146 612.1 1.4e-174 CCDS1961.1 GCFC2 gene_id:6936|Hs108|chr2 ( 781) 1170 149.6 2.1e-35 >>CCDS13619.1 PAXBP1 gene_id:94104|Hs108|chr21 (917 aa) initn: 6057 init1: 6057 opt: 6057 Z-score: 3819.8 bits: 718.0 E(32554): 1.9e-206 Smith-Waterman score: 6057; 100.0% identity (100.0% similar) in 917 aa overlap (1-917:1-917) 10 20 30 40 50 60 pF1KE3 MFRKARRVNVRKRNDSEEEERERDEEQEPPPLLPPPGTGEEAGPGGGDRAPGGESLLGPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 MFRKARRVNVRKRNDSEEEERERDEEQEPPPLLPPPGTGEEAGPGGGDRAPGGESLLGPG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 PSPPSALTPGLGAEAGGGFPGGAEPGNGLKPRKRPRENKEVPRASLLSFQDEEEENEEVF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 PSPPSALTPGLGAEAGGGFPGGAEPGNGLKPRKRPRENKEVPRASLLSFQDEEEENEEVF 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 KVKKSSYSKKIVKLLKKEYKEDLEKSKIKTELNSSAESEQPLDKTGHVKDTNQEDGVIIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 KVKKSSYSKKIVKLLKKEYKEDLEKSKIKTELNSSAESEQPLDKTGHVKDTNQEDGVIIS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 EHGEDEMDMESEKEEEKPKTGGAFSNALSSLNVLRPGEIPDAAFIHAARKKRQMARELGD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 EHGEDEMDMESEKEEEKPKTGGAFSNALSSLNVLRPGEIPDAAFIHAARKKRQMARELGD 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 FTPHDNEPGKGRLVREDENDASDDEDDDEKRRIVFSVKEKSQRQKIAEEIGIEGSDDDAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 FTPHDNEPGKGRLVREDENDASDDEDDDEKRRIVFSVKEKSQRQKIAEEIGIEGSDDDAL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE3 VTGEQDEELSRWEQEQIRKGINIPQVQASQPAEVNMYYQNTYQTMPYGSSYGIPYSYTAY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 VTGEQDEELSRWEQEQIRKGINIPQVQASQPAEVNMYYQNTYQTMPYGSSYGIPYSYTAY 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE3 GSSDAKSQKTDNTVPFKTPSNEMTPVTIDLVKKQLKDRLDSMKELHKTNRQQHEKHLQSR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 GSSDAKSQKTDNTVPFKTPSNEMTPVTIDLVKKQLKDRLDSMKELHKTNRQQHEKHLQSR 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE3 VDSTRAIERLEGSSGGIGERYKFLQEMRGYVQDLLECFSEKVPLINELESAIHQLYKQRA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 VDSTRAIERLEGSSGGIGERYKFLQEMRGYVQDLLECFSEKVPLINELESAIHQLYKQRA 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE3 SRLVQRRQDDIKDESSEFSSHSNKALMAPNLDSFGRDRALYQEHAKRRIAEREARRTRRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 SRLVQRRQDDIKDESSEFSSHSNKALMAPNLDSFGRDRALYQEHAKRRIAEREARRTRRR 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE3 QAREQTGKMADHLEGLSSDDEETSTDITNFNLEKDRISKESGKVFEDVLESFYSIDCIKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 QAREQTGKMADHLEGLSSDDEETSTDITNFNLEKDRISKESGKVFEDVLESFYSIDCIKS 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE3 QFEAWRSKYYTSYKDAYIGLCLPKLFNPLIRLQLLTWTPLEAKCRDFENMLWFESLLFYG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 QFEAWRSKYYTSYKDAYIGLCLPKLFNPLIRLQLLTWTPLEAKCRDFENMLWFESLLFYG 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE3 CEEREQEKDDVDVALLPTIVEKVILPKLTVIAENMWDPFSTTQTSRMVGITLKLINGYPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 CEEREQEKDDVDVALLPTIVEKVILPKLTVIAENMWDPFSTTQTSRMVGITLKLINGYPS 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE3 VVNAENKNTQVYLKALLLRMRRTLDDDVFMPLYPKNVLENKNSGPYLFFQRQFWSSVKLL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 VVNAENKNTQVYLKALLLRMRRTLDDDVFMPLYPKNVLENKNSGPYLFFQRQFWSSVKLL 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE3 GNFLQWYGIFSNKTLQELSIDGLLNRYILMAFQNSEYGDDSIKKAQNVINCFPKQWFMNL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 GNFLQWYGIFSNKTLQELSIDGLLNRYILMAFQNSEYGDDSIKKAQNVINCFPKQWFMNL 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE3 KGERTISQLENFCRYLVHLADTIYRNSIGCSDVEKRNARENIKQIVKLLASVRALDHAMS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 KGERTISQLENFCRYLVHLADTIYRNSIGCSDVEKRNARENIKQIVKLLASVRALDHAMS 850 860 870 880 890 900 910 pF1KE3 VASDHNVKEFKSLIEGK ::::::::::::::::: CCDS13 VASDHNVKEFKSLIEGK 910 >>CCDS33541.1 PAXBP1 gene_id:94104|Hs108|chr21 (815 aa) initn: 5210 init1: 5146 opt: 5146 Z-score: 3247.8 bits: 612.1 E(32554): 1.4e-174 Smith-Waterman score: 5146; 99.7% identity (100.0% similar) in 780 aa overlap (1-780:1-780) 10 20 30 40 50 60 pF1KE3 MFRKARRVNVRKRNDSEEEERERDEEQEPPPLLPPPGTGEEAGPGGGDRAPGGESLLGPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 MFRKARRVNVRKRNDSEEEERERDEEQEPPPLLPPPGTGEEAGPGGGDRAPGGESLLGPG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 PSPPSALTPGLGAEAGGGFPGGAEPGNGLKPRKRPRENKEVPRASLLSFQDEEEENEEVF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 PSPPSALTPGLGAEAGGGFPGGAEPGNGLKPRKRPRENKEVPRASLLSFQDEEEENEEVF 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 KVKKSSYSKKIVKLLKKEYKEDLEKSKIKTELNSSAESEQPLDKTGHVKDTNQEDGVIIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 KVKKSSYSKKIVKLLKKEYKEDLEKSKIKTELNSSAESEQPLDKTGHVKDTNQEDGVIIS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 EHGEDEMDMESEKEEEKPKTGGAFSNALSSLNVLRPGEIPDAAFIHAARKKRQMARELGD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 EHGEDEMDMESEKEEEKPKTGGAFSNALSSLNVLRPGEIPDAAFIHAARKKRQMARELGD 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 FTPHDNEPGKGRLVREDENDASDDEDDDEKRRIVFSVKEKSQRQKIAEEIGIEGSDDDAL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 FTPHDNEPGKGRLVREDENDASDDEDDDEKRRIVFSVKEKSQRQKIAEEIGIEGSDDDAL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE3 VTGEQDEELSRWEQEQIRKGINIPQVQASQPAEVNMYYQNTYQTMPYGSSYGIPYSYTAY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 VTGEQDEELSRWEQEQIRKGINIPQVQASQPAEVNMYYQNTYQTMPYGSSYGIPYSYTAY 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE3 GSSDAKSQKTDNTVPFKTPSNEMTPVTIDLVKKQLKDRLDSMKELHKTNRQQHEKHLQSR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 GSSDAKSQKTDNTVPFKTPSNEMTPVTIDLVKKQLKDRLDSMKELHKTNRQQHEKHLQSR 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE3 VDSTRAIERLEGSSGGIGERYKFLQEMRGYVQDLLECFSEKVPLINELESAIHQLYKQRA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 VDSTRAIERLEGSSGGIGERYKFLQEMRGYVQDLLECFSEKVPLINELESAIHQLYKQRA 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE3 SRLVQRRQDDIKDESSEFSSHSNKALMAPNLDSFGRDRALYQEHAKRRIAEREARRTRRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SRLVQRRQDDIKDESSEFSSHSNKALMAPNLDSFGRDRALYQEHAKRRIAEREARRTRRR 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE3 QAREQTGKMADHLEGLSSDDEETSTDITNFNLEKDRISKESGKVFEDVLESFYSIDCIKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 QAREQTGKMADHLEGLSSDDEETSTDITNFNLEKDRISKESGKVFEDVLESFYSIDCIKS 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE3 QFEAWRSKYYTSYKDAYIGLCLPKLFNPLIRLQLLTWTPLEAKCRDFENMLWFESLLFYG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 QFEAWRSKYYTSYKDAYIGLCLPKLFNPLIRLQLLTWTPLEAKCRDFENMLWFESLLFYG 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE3 CEEREQEKDDVDVALLPTIVEKVILPKLTVIAENMWDPFSTTQTSRMVGITLKLINGYPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 CEEREQEKDDVDVALLPTIVEKVILPKLTVIAENMWDPFSTTQTSRMVGITLKLINGYPS 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE3 VVNAENKNTQVYLKALLLRMRRTLDDDVFMPLYPKNVLENKNSGPYLFFQRQFWSSVKLL ::::::::::::::::::::::::::::::::::::::::::::::::::::::::::.. CCDS33 VVNAENKNTQVYLKALLLRMRRTLDDDVFMPLYPKNVLENKNSGPYLFFQRQFWSSVKVI 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE3 GNFLQWYGIFSNKTLQELSIDGLLNRYILMAFQNSEYGDDSIKKAQNVINCFPKQWFMNL CCDS33 KPPFQRGSCPIPRRKECCSERPRRIWTDRPCVVFS 790 800 810 >>CCDS1961.1 GCFC2 gene_id:6936|Hs108|chr2 (781 aa) initn: 1483 init1: 550 opt: 1170 Z-score: 749.0 bits: 149.6 E(32554): 2.1e-35 Smith-Waterman score: 1447; 33.9% identity (68.0% similar) in 741 aa overlap (179-915:95-779) 150 160 170 180 190 200 pF1KE3 KTELNSSAESEQPLDKTGHVKDTNQEDGVIISEHGEDEMDMESEKEEEKPKTGGAFSNAL .: ::.. ::..... .. . :..: CCDS19 RGRGRVWASSRRATKAAPRADEGSESRTLDVSTDEEDKIHHSSESKDDQGLSSDS-SSSL 70 80 90 100 110 120 210 220 230 240 250 260 pF1KE3 SSLNVLRPGEIPDAAFIHAARKKRQMARELGDFTPHD--NEPGKGRLVREDENDASDDED . .. .:::::::.:::.::..:: :. : . . . . ::.:.: .. : CCDS19 GEKELSSTVKIPDAAFIQAARRKRELARAQDDYISLDVQHTSSISGMKRESEDDPESEPD 130 140 150 160 170 180 270 280 290 300 310 320 pF1KE3 DDEKRRIVFSVKEKSQRQKIAEEIGIEGSDDDALVTGEQDEELSRWEQEQIRKGINIPQV : ::: : :... .. ::..::: .: . .... ...::. . :::.:.::...: . CCDS19 DHEKR-IPFTLRPQTLRQRMAEE-SI-SRNEETSEESQEDEKQDTWEQQQMRKAVKIIEE 190 200 210 220 230 240 330 340 350 360 370 380 pF1KE3 QASQPAEVNMYYQNTYQTMPYGSSYGIPYSYTAYGSSDAKSQKTDNTVPFKTPSNEMTPV . .... . :....: .: :... : : :: CCDS19 R-----DIDL----------------------SCGNGSSKVKKFDTSISF--P-----PV 250 260 390 400 410 420 430 440 pF1KE3 TIDLVKKQLKDRLDSMKELHKTNRQQHEKHLQSRVDSTRAIERLEGSSGGIGERYKFLQE .....::::. :: ..: :... ...::..:. .: .:. ::.::. . :: . CCDS19 NLEIIKKQLNTRLTLLQETHRSHLREYEKYVQDVKSSKSTIQNLESSSNQ-ALNCKFYKS 270 280 290 300 310 320 450 460 470 480 490 500 pF1KE3 MRGYVQDLLECFSEKVPLINELESAIHQLYKQRASRLVQRRQDDIKDESSEFSSHSNKAL :. ::..:..:..::. :.:.::..: : ..: ...::::..: ::. ... : : CCDS19 MKIYVENLIDCLNEKIINIQEIESSMHALLLKQAMTFMKRRQDELKHESTYLQQLSRKDE 330 340 350 360 370 380 510 520 530 540 550 560 pF1KE3 MAPNLDSFGRDRALYQEHAKRRIAEREARRTRRRQAREQTGKMADHLEGLSSDDEETSTD . . .:. : :... . : :.:::.::::: .:. .: :: ::::: :.. CCDS19 TSTS-GNFSVD-----EKTQWILEEIESRRTKRRQARVLSGN-CNHQEGTSSDDELPSAE 390 400 410 420 430 570 580 590 600 610 620 pF1KE3 ITNFNLEKDRISKESGKVFEDVLESFYSIDCIKSQFEAWRSKYYTSYKDAYIGLCLPKLF . .:. . : ... ::::.: ..: .:. : .:. :: :. :: .:.:.::.:::. CCDS19 MIDFQKSQGDILQKQKKVFEEVQDDFCNIQNILLKFQQWREKFPDSYYEAFISLCIPKLL 440 450 460 470 480 490 630 640 650 660 670 680 pF1KE3 NPLIRLQLLTWTPLEAKCRDFENMLWFESLLFY--GCEEREQEKDDVDVALLPTIVEKVI :::::.::. :.::. . ...: ::.:. . . : ..... : .: .:..:.: CCDS19 NPLIRVQLIDWNPLKLESTGLKEMPWFKSVEEFMDSSVEDSKKESSSDKKVLSAIINKTI 500 510 520 530 540 550 690 700 710 720 730 740 pF1KE3 LPKLTVIAENMWDPFSTTQTSRMVGITLKLINGYPSVVNAENKNTQVYLKALLLRMRRTL .:.:: ..: .:::.::.::. .. ... . . : .:. : ::... ::.... CCDS19 IPRLTDFVEFLWDPLSTSQTTSLITHCRVILEEHSTCENEVSKSRQDLLKSIVSRMKKAV 560 570 580 590 600 610 750 760 770 780 790 800 pF1KE3 DDDVFMPLYPKNVLENKNSGPYLFFQRQFWSSVKLLGNFLQWYGIFSNKTLQELSIDGLL .::::.:::::...:::.: : .:::::..::. :.: : :.... :::::.. :: CCDS19 EDDVFIPLYPKSAVENKTSPHSKFQERQFWSGLKLFRNILLWNGLLTDDTLQELGLGKLL 620 630 640 650 660 670 810 820 830 840 850 860 pF1KE3 NRYILMAFQNSEYGDDSIKKAQNVINCFPKQWFMNLKGERTISQLENFCRYLVHLADTIY :::...:. :. : : .:: ..: :.:..:: : . .: ::::: ..:.. : . CCDS19 NRYLIIALLNATPGPDVVKKCNQVAACLPEKWFENSAMRTSIPQLENFIQFLLQSAHKLS 680 690 700 710 720 730 870 880 890 900 910 pF1KE3 RNSIGCSDVEKRNARENIKQIVKLLASVRALDHAMSVASDHNVKEFKSLIEGK :. . :.....:. .:....::..: : ..:.. ..::::. CCDS19 RSEF----------RDEVEEIILILVKIKALNQAESFIGEHHLDHLKSLIKED 740 750 760 770 780 917 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 05:04:15 2016 done: Sun Nov 6 05:04:16 2016 Total Scan time: 4.950 Total Display time: 0.070 Function used was FASTA [36.3.4 Apr, 2011]