FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB6282, 781 aa 1>>>pF1KB6282 781 - 781 aa - 781 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 7.6049+/-0.00106; mu= 12.3281+/- 0.064 mean_var=175.9497+/-34.899, 0's: 0 Z-trim(110.0): 28 B-trim: 62 in 1/51 Lambda= 0.096690 statistics sampled from 11296 (11309) to 11296 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.693), E-opt: 0.2 (0.347), width: 16 Scan time: 4.550 The best scores are: opt bits E(32554) CCDS1961.1 GCFC2 gene_id:6936|Hs108|chr2 ( 781) 5083 721.8 1e-207 CCDS62943.1 GCFC2 gene_id:6936|Hs108|chr2 ( 215) 1358 201.7 1e-51 CCDS13619.1 PAXBP1 gene_id:94104|Hs108|chr21 ( 917) 1169 175.9 2.6e-43 CCDS33541.1 PAXBP1 gene_id:94104|Hs108|chr21 ( 815) 925 141.8 4.2e-33 >>CCDS1961.1 GCFC2 gene_id:6936|Hs108|chr2 (781 aa) initn: 5083 init1: 5083 opt: 5083 Z-score: 3842.8 bits: 721.8 E(32554): 1e-207 Smith-Waterman score: 5083; 99.6% identity (100.0% similar) in 781 aa overlap (1-781:1-781) 10 20 30 40 50 60 pF1KB6 MAHRPKRTFRQRAADSSDSDGAEESPAEPGAPRELPVPGSAEEEPPSGGGRAQVAGLPHR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 MAHRPKRTFRQRAADSSDSDGAEESPAEPGAPRELPVPGSAEEEPPSGGGRAQVAGLPHR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB6 IRGPRGRGRVWASSRRATKAAPRADEGSESRTLDVSTDEEDKIHHSSESKDDQGLSSDSS .::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 VRGPRGRGRVWASSRRATKAAPRADEGSESRTLDVSTDEEDKIHHSSESKDDQGLSSDSS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB6 SSLGEKELSSTVKIPDAAFIQAARRKRELARAQDDYISLDVQHTSSISGMKRESEDDPES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 SSLGEKELSSTVKIPDAAFIQAARRKRELARAQDDYISLDVQHTSSISGMKRESEDDPES 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB6 EPDDHEKRIPFTLRPQTLRQRMAEESISRNEETSEESQEDEKQDTWEQQQMRKAVKIIEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 EPDDHEKRIPFTLRPQTLRQRMAEESISRNEETSEESQEDEKQDTWEQQQMRKAVKIIEE 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB6 RDIDLSCGSGSSKVKKFDTSISFPPVNLEIIKKQLNTRLTLLQETHRSHLREYEKYVQDV ::::::::.::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 RDIDLSCGNGSSKVKKFDTSISFPPVNLEIIKKQLNTRLTLLQETHRSHLREYEKYVQDV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB6 KSSKSTIQNLESSSNQALNCKFYKSMKIYVENLIDCLNEKIINIQEIESSMHALLLKQAM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 KSSKSTIQNLESSSNQALNCKFYKSMKIYVENLIDCLNEKIINIQEIESSMHALLLKQAM 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB6 TFMKRRQDELKHESTYLQQLSRKDETSTSGNFSVDEKTQWILEEIESRRTKRRQARVLSG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 TFMKRRQDELKHESTYLQQLSRKDETSTSGNFSVDEKTQWILEEIESRRTKRRQARVLSG 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB6 NCNHQEGTSSDDELPSAEMIDFQKSQGDILQKQKKVFEEVQDDFCNIQNILLKFQQWREK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 NCNHQEGTSSDDELPSAEMIDFQKSQGDILQKQKKVFEEVQDDFCNIQNILLKFQQWREK 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB6 FPDSYYEAFISLCIPKLLNPLIRVQLIDWNPLKLESTGLKEMPWFKSVEEFMDSSVEDSK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 FPDSYYEAFISLCIPKLLNPLIRVQLIDWNPLKLESTGLKEMPWFKSVEEFMDSSVEDSK 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB6 KESSSDKKVLSAIINKTIIPRLTDFVEFLWDPLSTSQTTSLITHCRVILEEHSACENEVS :::::::::::::::::::::::::::::::::::::::::::::::::::::.:::::: CCDS19 KESSSDKKVLSAIINKTIIPRLTDFVEFLWDPLSTSQTTSLITHCRVILEEHSTCENEVS 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB6 KSRQDLLKSIVSRMKKAVEDDVFIPLYPKSAVENKTSPHSKFQERQFWSGLKLFRNILLW :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 KSRQDLLKSIVSRMKKAVEDDVFIPLYPKSAVENKTSPHSKFQERQFWSGLKLFRNILLW 610 620 630 640 650 660 670 680 690 700 710 720 pF1KB6 NGLLTDDTLQELGLGKLLNRYLIIALLNATPGPDVVKKCNQVAACLPEKWFENSAMRTSI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 NGLLTDDTLQELGLGKLLNRYLIIALLNATPGPDVVKKCNQVAACLPEKWFENSAMRTSI 670 680 690 700 710 720 730 740 750 760 770 780 pF1KB6 PQLENFIQFLLQSAHKLSRSEFRDEVEEIILILVKIKALNQAESFIGEHHLDHLKSLIKE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 PQLENFIQFLLQSAHKLSRSEFRDEVEEIILILVKIKALNQAESFIGEHHLDHLKSLIKE 730 740 750 760 770 780 pF1KB6 D : CCDS19 D >>CCDS62943.1 GCFC2 gene_id:6936|Hs108|chr2 (215 aa) initn: 1358 init1: 1358 opt: 1358 Z-score: 1041.9 bits: 201.7 E(32554): 1e-51 Smith-Waterman score: 1358; 99.5% identity (100.0% similar) in 206 aa overlap (1-206:1-206) 10 20 30 40 50 60 pF1KB6 MAHRPKRTFRQRAADSSDSDGAEESPAEPGAPRELPVPGSAEEEPPSGGGRAQVAGLPHR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 MAHRPKRTFRQRAADSSDSDGAEESPAEPGAPRELPVPGSAEEEPPSGGGRAQVAGLPHR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB6 IRGPRGRGRVWASSRRATKAAPRADEGSESRTLDVSTDEEDKIHHSSESKDDQGLSSDSS .::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 VRGPRGRGRVWASSRRATKAAPRADEGSESRTLDVSTDEEDKIHHSSESKDDQGLSSDSS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB6 SSLGEKELSSTVKIPDAAFIQAARRKRELARAQDDYISLDVQHTSSISGMKRESEDDPES :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS62 SSLGEKELSSTVKIPDAAFIQAARRKRELARAQDDYISLDVQHTSSISGMKRESEDDPES 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB6 EPDDHEKRIPFTLRPQTLRQRMAEESISRNEETSEESQEDEKQDTWEQQQMRKAVKIIEE :::::::::::::::::::::::::: CCDS62 EPDDHEKRIPFTLRPQTLRQRMAEESSMDLPIYED 190 200 210 >>CCDS13619.1 PAXBP1 gene_id:94104|Hs108|chr21 (917 aa) initn: 1482 init1: 549 opt: 1169 Z-score: 891.1 bits: 175.9 E(32554): 2.6e-43 Smith-Waterman score: 1450; 34.1% identity (68.2% similar) in 742 aa overlap (95-779:179-915) 70 80 90 100 110 120 pF1KB6 RGRGRVWASSRRATKAAPRADEGSESRTLDVSTDEEDKIHHSSESKDDQGLSSDS-SSSL .: ::.. ::..... .. . :..: CCDS13 KTELNSSAESEQPLDKTGHVKDTNQEDGVIISEHGEDEMDMESEKEEEKPKTGGAFSNAL 150 160 170 180 190 200 130 140 150 160 170 180 pF1KB6 GEKELSSTVKIPDAAFIQAARRKRELARAQDDYISLDVQHTSSISGMKRESEDDPESEPD . .. .:::::::.:::.::..:: :. : . . . . ::.:.: .. : CCDS13 SSLNVLRPGEIPDAAFIHAARKKRQMARELGDFTPHD--NEPGKGRLVREDENDASDDED 210 220 230 240 250 260 190 200 210 220 230 240 pF1KB6 DHEKR-IPFTLRPQTLRQRMAEE-SI-SRNEETSEESQEDEKQDTWEQQQMRKAVKIIEE : ::: : :... .. ::..::: .: . .... ...::. . :::.:.::...: . CCDS13 DDEKRRIVFSVKEKSQRQKIAEEIGIEGSDDDALVTGEQDEELSRWEQEQIRKGINIPQV 270 280 290 300 310 320 250 260 pF1KB6 R-----DIDL----------------------SCGSGSSKVKKFDTSISF--P-----PV . .... . ::...: .: :... : : :: CCDS13 QASQPAEVNMYYQNTYQTMPYGSSYGIPYSYTAYGSSDAKSQKTDNTVPFKTPSNEMTPV 330 340 350 360 370 380 270 280 290 300 310 320 pF1KB6 NLEIIKKQLNTRLTLLQETHRSHLREYEKYVQDVKSSKSTIQNLESSSNQ-ALNCKFYKS .....::::. :: ..: :... ...::..:. .: .:. ::.::. . :: . CCDS13 TIDLVKKQLKDRLDSMKELHKTNRQQHEKHLQSRVDSTRAIERLEGSSGGIGERYKFLQE 390 400 410 420 430 440 330 340 350 360 370 380 pF1KB6 MKIYVENLIDCLNEKIINIQEIESSMHALLLKQAMTFMKRRQDELKHESTYLQQLSRKDE :. ::..:..:..::. :.:.::..: : ..: ...::::..: ::. ... : : CCDS13 MRGYVQDLLECFSEKVPLINELESAIHQLYKQRASRLVQRRQDDIKDESSEFSSHSNKAL 450 460 470 480 490 500 390 400 410 420 430 pF1KB6 TSTS-GNFSVD-----EKTQWILEEIESRRTKRRQARVLSGN-CNHQEGTSSDDELPSAE . . .:. : :... . : :.:::.::::: .:. .: :: ::::: :.. CCDS13 MAPNLDSFGRDRALYQEHAKRRIAEREARRTRRRQAREQTGKMADHLEGLSSDDEETSTD 510 520 530 540 550 560 440 450 460 470 480 490 pF1KB6 MIDFQKSQGDILQKQKKVFEEVQDDFCNIQNILLKFQQWREKFPDSYYEAFISLCIPKLL . .:. . : ... ::::.: ..: .:. : .:. :: :. :: .:.:.::.:::. CCDS13 ITNFNLEKDRISKESGKVFEDVLESFYSIDCIKSQFEAWRSKYYTSYKDAYIGLCLPKLF 570 580 590 600 610 620 500 510 520 530 540 550 pF1KB6 NPLIRVQLIDWNPLKLESTGLKEMPWFKSVEEFMDSSVEDSKKESSS-DKKVLSAIINKT :::::.::. :.::. . ...: ::.:. . . :. ..:... : .: .:..:. CCDS13 NPLIRLQLLTWTPLEAKCRDFENMLWFESLLFY---GCEEREQEKDDVDVALLPTIVEKV 630 640 650 660 670 680 560 570 580 590 600 610 pF1KB6 IIPRLTDFVEFLWDPLSTSQTTSLITHCRVILEEHSACENEVSKSRQDLLKSIVSRMKKA :.:.:: ..: .:::.::.::. .. ... . . : .:. : ::... ::... CCDS13 ILPKLTVIAENMWDPFSTTQTSRMVGITLKLINGYPSVVNAENKNTQVYLKALLLRMRRT 690 700 710 720 730 740 620 630 640 650 660 670 pF1KB6 VEDDVFIPLYPKSAVENKTSPHSKFQERQFWSGLKLFRNILLWNGLLTDDTLQELGLGKL ..::::.:::::...:::.: : .:::::..::. :.: : :.... :::::.. : CCDS13 LDDDVFMPLYPKNVLENKNSGPYLFFQRQFWSSVKLLGNFLQWYGIFSNKTLQELSIDGL 750 760 770 780 790 800 680 690 700 710 720 730 pF1KB6 LNRYLIIALLNATPGPDVVKKCNQVAACLPEKWFENSAMRTSIPQLENFIQFLLQSAHKL ::::...:. :. : : .:: ..: :.:..:: : . .: ::::: ..:.. : . CCDS13 LNRYILMAFQNSEYGDDSIKKAQNVINCFPKQWFMNLKGERTISQLENFCRYLVHLADTI 810 820 830 840 850 860 740 750 760 770 780 pF1KB6 SRSEF----------RDEVEEIILILVKIKALNQAESFIGEHHLDHLKSLIKED :. . :.....:. .:....::..: : ..:.. ..::::. CCDS13 YRNSIGCSDVEKRNARENIKQIVKLLASVRALDHAMSVASDHNVKEFKSLIEGK 870 880 890 900 910 >>CCDS33541.1 PAXBP1 gene_id:94104|Hs108|chr21 (815 aa) initn: 1189 init1: 324 opt: 925 Z-score: 707.9 bits: 141.8 E(32554): 4.2e-33 Smith-Waterman score: 1146; 33.7% identity (67.9% similar) in 608 aa overlap (95-655:179-781) 70 80 90 100 110 120 pF1KB6 RGRGRVWASSRRATKAAPRADEGSESRTLDVSTDEEDKIHHSSESKDDQGLSSDS-SSSL .: ::.. ::..... .. . :..: CCDS33 KTELNSSAESEQPLDKTGHVKDTNQEDGVIISEHGEDEMDMESEKEEEKPKTGGAFSNAL 150 160 170 180 190 200 130 140 150 160 170 180 pF1KB6 GEKELSSTVKIPDAAFIQAARRKRELARAQDDYISLDVQHTSSISGMKRESEDDPESEPD . .. .:::::::.:::.::..:: :. : . . . . ::.:.: .. : CCDS33 SSLNVLRPGEIPDAAFIHAARKKRQMARELGDFTPHD--NEPGKGRLVREDENDASDDED 210 220 230 240 250 260 190 200 210 220 230 240 pF1KB6 DHEKR-IPFTLRPQTLRQRMAEE-SI-SRNEETSEESQEDEKQDTWEQQQMRKAVKIIEE : ::: : :... .. ::..::: .: . .... ...::. . :::.:.::...: . CCDS33 DDEKRRIVFSVKEKSQRQKIAEEIGIEGSDDDALVTGEQDEELSRWEQEQIRKGINIPQV 270 280 290 300 310 320 250 260 pF1KB6 R-----DIDL----------------------SCGSGSSKVKKFDTSISF--P-----PV . .... . ::...: .: :... : : :: CCDS33 QASQPAEVNMYYQNTYQTMPYGSSYGIPYSYTAYGSSDAKSQKTDNTVPFKTPSNEMTPV 330 340 350 360 370 380 270 280 290 300 310 320 pF1KB6 NLEIIKKQLNTRLTLLQETHRSHLREYEKYVQDVKSSKSTIQNLESSSNQ-ALNCKFYKS .....::::. :: ..: :... ...::..:. .: .:. ::.::. . :: . CCDS33 TIDLVKKQLKDRLDSMKELHKTNRQQHEKHLQSRVDSTRAIERLEGSSGGIGERYKFLQE 390 400 410 420 430 440 330 340 350 360 370 380 pF1KB6 MKIYVENLIDCLNEKIINIQEIESSMHALLLKQAMTFMKRRQDELKHESTYLQQLSRKDE :. ::..:..:..::. :.:.::..: : ..: ...::::..: ::. ... : : CCDS33 MRGYVQDLLECFSEKVPLINELESAIHQLYKQRASRLVQRRQDDIKDESSEFSSHSNKAL 450 460 470 480 490 500 390 400 410 420 430 pF1KB6 TSTS-GNFSVD-----EKTQWILEEIESRRTKRRQARVLSGN-CNHQEGTSSDDELPSAE . . .:. : :... . : :.:::.::::: .:. .: :: ::::: :.. CCDS33 MAPNLDSFGRDRALYQEHAKRRIAEREARRTRRRQAREQTGKMADHLEGLSSDDEETSTD 510 520 530 540 550 560 440 450 460 470 480 490 pF1KB6 MIDFQKSQGDILQKQKKVFEEVQDDFCNIQNILLKFQQWREKFPDSYYEAFISLCIPKLL . .:. . : ... ::::.: ..: .:. : .:. :: :. :: .:.:.::.:::. CCDS33 ITNFNLEKDRISKESGKVFEDVLESFYSIDCIKSQFEAWRSKYYTSYKDAYIGLCLPKLF 570 580 590 600 610 620 500 510 520 530 540 550 pF1KB6 NPLIRVQLIDWNPLKLESTGLKEMPWFKSVEEFMDSSVEDSKKESSS-DKKVLSAIINKT :::::.::. :.::. . ...: ::.:. . . :. ..:... : .: .:..:. CCDS33 NPLIRLQLLTWTPLEAKCRDFENMLWFESLLFY---GCEEREQEKDDVDVALLPTIVEKV 630 640 650 660 670 680 560 570 580 590 600 610 pF1KB6 IIPRLTDFVEFLWDPLSTSQTTSLITHCRVILEEHSACENEVSKSRQDLLKSIVSRMKKA :.:.:: ..: .:::.::.::. .. ... . . : .:. : ::... ::... CCDS33 ILPKLTVIAENMWDPFSTTQTSRMVGITLKLINGYPSVVNAENKNTQVYLKALLLRMRRT 690 700 710 720 730 740 620 630 640 650 660 670 pF1KB6 VEDDVFIPLYPKSAVENKTSPHSKFQERQFWSGLKLFRNILLWNGLLTDDTLQELGLGKL ..::::.:::::...:::.: : .:::::..:... CCDS33 LDDDVFMPLYPKNVLENKNSGPYLFFQRQFWSSVKVIKPPFQRGSCPIPRRKECCSERPR 750 760 770 780 790 800 680 690 700 710 720 730 pF1KB6 LNRYLIIALLNATPGPDVVKKCNQVAACLPEKWFENSAMRTSIPQLENFIQFLLQSAHKL CCDS33 RIWTDRPCVVFS 810 781 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 05:23:18 2016 done: Sun Nov 6 05:23:19 2016 Total Scan time: 4.550 Total Display time: 0.070 Function used was FASTA [36.3.4 Apr, 2011]