FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE3975, 247 aa 1>>>pF1KE3975 247 - 247 aa - 247 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.0081+/-0.000963; mu= 11.8507+/- 0.058 mean_var=112.7930+/-22.947, 0's: 0 Z-trim(108.4): 114 B-trim: 0 in 0/51 Lambda= 0.120763 statistics sampled from 10022 (10157) to 10022 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.7), E-opt: 0.2 (0.312), width: 16 Scan time: 1.980 The best scores are: opt bits E(32554) CCDS1946.2 PCGF1 gene_id:84759|Hs108|chr2 ( 259) 1693 305.6 2.2e-83 CCDS7138.1 BMI1 gene_id:648|Hs108|chr10 ( 326) 571 110.2 1.8e-24 CCDS59213.1 BMI1 gene_id:100532731|Hs108|chr10 ( 469) 571 110.3 2.3e-24 CCDS32638.1 PCGF2 gene_id:7703|Hs108|chr17 ( 344) 543 105.3 5.5e-23 CCDS31275.1 PCGF6 gene_id:84108|Hs108|chr10 ( 350) 524 102.0 5.5e-22 CCDS7413.1 PCGF5 gene_id:84333|Hs108|chr10 ( 256) 504 98.4 4.9e-21 CCDS3339.2 PCGF3 gene_id:10336|Hs108|chr4 ( 242) 448 88.6 4.1e-18 CCDS7546.1 PCGF6 gene_id:84108|Hs108|chr10 ( 275) 310 64.6 7.7e-11 >>CCDS1946.2 PCGF1 gene_id:84759|Hs108|chr2 (259 aa) initn: 1693 init1: 1693 opt: 1693 Z-score: 1610.6 bits: 305.6 E(32554): 2.2e-83 Smith-Waterman score: 1693; 100.0% identity (100.0% similar) in 247 aa overlap (1-247:13-259) 10 20 30 40 pF1KE3 MRLRNQLQSVYKMDPLRNEEEVRVKIKDLNEHIVCCLCAGYFVDATTI :::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 MASPQGGQIAIAMRLRNQLQSVYKMDPLRNEEEVRVKIKDLNEHIVCCLCAGYFVDATTI 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE3 TECLHTFCKSCIVKYLQTSKYCPMCNIKIHETQPLLNLKLDRVMQDIVYKLVPGLQDSEE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 TECLHTFCKSCIVKYLQTSKYCPMCNIKIHETQPLLNLKLDRVMQDIVYKLVPGLQDSEE 70 80 90 100 110 120 110 120 130 140 150 160 pF1KE3 KRIREFYQSRGLDRVTQPTGEEPALSNLGLPFSSFDHSKAHYYRYDEQLNLCLERLSSGK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 KRIREFYQSRGLDRVTQPTGEEPALSNLGLPFSSFDHSKAHYYRYDEQLNLCLERLSSGK 130 140 150 160 170 180 170 180 190 200 210 220 pF1KE3 DKNKSVLQNKYVRCSVRAEVRHLRRVLCHRLMLNPQHVQLLFDNEVLPDHMTMKQIWLSR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS19 DKNKSVLQNKYVRCSVRAEVRHLRRVLCHRLMLNPQHVQLLFDNEVLPDHMTMKQIWLSR 190 200 210 220 230 240 230 240 pF1KE3 WFGKPSPLLLQYSVKEKRR ::::::::::::::::::: CCDS19 WFGKPSPLLLQYSVKEKRR 250 >>CCDS7138.1 BMI1 gene_id:648|Hs108|chr10 (326 aa) initn: 511 init1: 478 opt: 571 Z-score: 552.8 bits: 110.2 E(32554): 1.8e-24 Smith-Waterman score: 578; 41.6% identity (70.0% similar) in 233 aa overlap (23-243:6-228) 10 20 30 40 50 60 pF1KE3 MRLRNQLQSVYKMDPLRNEEEVRVKIKDLNEHIVCCLCAGYFVDATTITECLHTFCKSCI :.:: .:: :..: ::.:::.::::: ::::.:::.:: CCDS71 MHRTTRIKITELNPHLMCVLCGGYFIDATTIIECLHSFCKTCI 10 20 30 40 70 80 90 100 110 120 pF1KE3 VKYLQTSKYCPMCNIKIHETQPLLNLKLDRVMQDIVYKLVPGLQDSEEKRIREFYQSRGL :.::.::::::.:....:.:.::::.. :...::::::::::: .: :: :.:: . CCDS71 VRYLETSKYCPICDVQVHKTRPLLNIRSDKTLQDIVYKLVPGLFKNEMKRRRDFYAA--- 50 60 70 80 90 100 130 140 150 160 170 pF1KE3 DRVTQPTGEEPALSNLGLPFSSFDHSKAHYYRYDEQLNLCLE-----RLSS--GKDKNKS .:... :: . :..: . :: ..: .: ::. .:::.:: CCDS71 ----HPSADAANGSNEDRGEVA-DEDK-RIITDDEIISLSIEFFDQNRLDRKVNKDKEKS 110 120 130 140 150 180 190 200 210 220 pF1KE3 ---VLQNKYVRCSVRAEVRHLRRVLCHRLML-NPQHVQLLFDNEVLPDHMTMKQI-WLSR : ...:.:: . : :::. : .. . : ........: : :..:. .: .. CCDS71 KEEVNDKRYLRCPAAMTVMHLRKFLRSKMDIPNTFQIDVMYEEEPLKDYYTLMDIAYIYT 160 170 180 190 200 210 230 240 pF1KE3 WFGKPSPLLLQYSVKEKRR : . .:: :.: :. CCDS71 WR-RNGPLPLKYRVRPTCKRMKISHQRDGLTNAGELESDSGSDKANSPAGGIPSTSSCLP 220 230 240 250 260 270 >>CCDS59213.1 BMI1 gene_id:100532731|Hs108|chr10 (469 aa) initn: 511 init1: 478 opt: 571 Z-score: 550.8 bits: 110.3 E(32554): 2.3e-24 Smith-Waterman score: 578; 41.6% identity (70.0% similar) in 233 aa overlap (23-243:149-371) 10 20 30 40 50 pF1KE3 MRLRNQLQSVYKMDPLRNEEEVRVKIKDLNEHIVCCLCAGYFVDATTITECL :.:: .:: :..: ::.:::.::::: ::: CCDS59 LIPHPIQRLVLVAAWNNYRIFYQAEMHRTTRIKITELNPHLMCVLCGGYFIDATTIIECL 120 130 140 150 160 170 60 70 80 90 100 110 pF1KE3 HTFCKSCIVKYLQTSKYCPMCNIKIHETQPLLNLKLDRVMQDIVYKLVPGLQDSEEKRIR :.:::.:::.::.::::::.:....:.:.::::.. :...::::::::::: .: :: : CCDS59 HSFCKTCIVRYLETSKYCPICDVQVHKTRPLLNIRSDKTLQDIVYKLVPGLFKNEMKRRR 180 190 200 210 220 230 120 130 140 150 160 pF1KE3 EFYQSRGLDRVTQPTGEEPALSNLGLPFSSFDHSKAHYYRYDEQLNLCLE-----RLSS- .:: . .:... :: . :..: . :: ..: .: ::. CCDS59 DFYAA-------HPSADAANGSNEDRGEVA-DEDK-RIITDDEIISLSIEFFDQNRLDRK 240 250 260 270 280 170 180 190 200 210 220 pF1KE3 -GKDKNKS---VLQNKYVRCSVRAEVRHLRRVLCHRLML-NPQHVQLLFDNEVLPDHMTM .:::.:: : ...:.:: . : :::. : .. . : ........: : :..:. CCDS59 VNKDKEKSKEEVNDKRYLRCPAAMTVMHLRKFLRSKMDIPNTFQIDVMYEEEPLKDYYTL 290 300 310 320 330 340 230 240 pF1KE3 KQI-WLSRWFGKPSPLLLQYSVKEKRR .: .. : . .:: :.: :. CCDS59 MDIAYIYTWR-RNGPLPLKYRVRPTCKRMKISHQRDGLTNAGELESDSGSDKANSPAGGI 350 360 370 380 390 400 >>CCDS32638.1 PCGF2 gene_id:7703|Hs108|chr17 (344 aa) initn: 513 init1: 486 opt: 543 Z-score: 526.2 bits: 105.3 E(32554): 5.5e-23 Smith-Waterman score: 552; 38.3% identity (69.8% similar) in 235 aa overlap (23-243:6-230) 10 20 30 40 50 60 pF1KE3 MRLRNQLQSVYKMDPLRNEEEVRVKIKDLNEHIVCCLCAGYFVDATTITECLHTFCKSCI :.:: .:: :..: ::.:::.:::::.::::.:::.:: CCDS32 MHRTTRIKITELNPHLMCALCGGYFIDATTIVECLHSFCKTCI 10 20 30 40 70 80 90 100 110 120 pF1KE3 VKYLQTSKYCPMCNIKIHETQPLLNLKLDRVMQDIVYKLVPGLQDSEEKRIREFYQSRGL :.::.:.::::::....:.:.:::... :...::::::::::: .: :: :.:: . : CCDS32 VRYLETNKYCPMCDVQVHKTRPLLSIRSDKTLQDIVYKLVPGLFKDEMKRRRDFYAAYPL 50 60 70 80 90 100 130 140 150 160 170 pF1KE3 DRVTQPTGEEPALSNLGLPFSSFDHSKAHYYRYDEQLNLCLERLSSGKDKN--KSVLQN- .: :.: . ... ... :. :: ..: .: ...:.. :. :.: CCDS32 TEV--PNGSNEDRGEV------LEQEKGALSD-DEIVSLSIEFYEGARDRDEKKGPLENG 110 120 130 140 150 180 190 200 210 220 pF1KE3 ---------KYVRCSVRAEVRHLRRVLCHRLMLNPQH-VQLLFDNEVLPDHMTMKQI-WL ...:: . : :: . : ... . .. :..:...: : ...:. .: .. CCDS32 DGDKEKTGVRFLRCPAAMTVMHLAKFLRNKMDVPSKYKVEVLYEDEPLKEYYTLMDIAYI 160 170 180 190 200 210 230 240 pF1KE3 SRWFGKPSPLLLQYSVKEKRR : . .:: :.: :. CCDS32 YPWR-RNGPLPLKYRVQPACKRLTLATVPTPSEGTNTSGASECESVSDKAPSPATLPATS 220 230 240 250 260 270 >>CCDS31275.1 PCGF6 gene_id:84108|Hs108|chr10 (350 aa) initn: 443 init1: 443 opt: 524 Z-score: 508.2 bits: 102.0 E(32554): 5.5e-22 Smith-Waterman score: 524; 38.9% identity (74.4% similar) in 211 aa overlap (18-224:117-322) 10 20 30 40 pF1KE3 MRLRNQLQSVYKMDPLRNEEEVRVKIKDLNEHIVCCLCAGYFVDATT .::: .....:. .:.: .: ::..:::: CCDS31 EEELEEEEEEEEEDMSHFSLRLEGGRQDSEDEEERLINLSELTPYILCSICKGYLIDATT 90 100 110 120 130 140 50 60 70 80 90 100 pF1KE3 ITECLHTFCKSCIVKYLQTSKYCPMCNIKIHETQPLLNLKLDRVMQDIVYKLVPGLQDSE ::::::::::::::... :. :: ::: .:.:::: :..::: .:::::::: .:.. : CCDS31 ITECLHTFCKSCIVRHFYYSNRCPKCNIVVHQTQPLYNIRLDRQLQDIVYKLVINLEERE 150 160 170 180 190 200 110 120 130 140 150 160 pF1KE3 EKRIREFYQSRGLDRVTQPTGEEPALSNLGLPFSSFDHSKAHYYRYDEQLN--LCLERLS .:....::. :::. : .:. .:. :. : . .. .: .:. : :: .. CCDS31 KKQMHDFYKERGLE-VPKPAVPQPVPSSKGRSKKVLES----VFRIPPELDMSLLLEFIG 210 220 230 240 250 260 170 180 190 200 210 220 pF1KE3 SGKDKNK-SVLQNKYVRCSVRAEVRHLRRVLCHRLMLNPQ-HVQLLFDNEVLPDHMTMKQ ... .. . :..:.:: : .: . :... : ... :.: .:... ...: ...:... CCDS31 ANEGTGHFKPLEKKFVRVSGEATIGHVEKFLRRKMGLDPACQVDIICGDHLLEQYQTLRE 270 280 290 300 310 320 230 240 pF1KE3 IWLSRWFGKPSPLLLQYSVKEKRR : CCDS31 IRRAIGDAAMQDGLLVLHYGLVVSPLKIT 330 340 350 >>CCDS7413.1 PCGF5 gene_id:84333|Hs108|chr10 (256 aa) initn: 462 init1: 363 opt: 504 Z-score: 491.1 bits: 98.4 E(32554): 4.9e-21 Smith-Waterman score: 504; 36.4% identity (70.6% similar) in 214 aa overlap (26-229:9-215) 10 20 30 40 50 60 pF1KE3 MRLRNQLQSVYKMDPLRNEEEVRVKIKDLNEHIVCCLCAGYFVDATTITECLHTFCKSCI .::.: .:.: .: ::.. ::.:::::::::.:: CCDS74 MATQRKHLVKDFNPYITCYICKGYLIKPTTVTECLHTFCKTCI 10 20 30 40 70 80 90 100 110 pF1KE3 VKYLQTSKYCPMCNIKIHETQPLLNLKLDRVMQDIVYKLVPGLQDSEEKRIREFY----- :.... :. :: :. ..:::.:: :.:: ....:..::::::...: .: ::. CCDS74 VQHFEDSNDCPRCGNQVHETNPLEMLRLDNTLEEIIFKLVPGLREQELERESEFWKKNKP 50 60 70 80 90 100 120 130 140 150 160 170 pF1KE3 QSRGLDRVTQPTGEEPALSNLGLPFSSFDHSKAHYYRYDEQLNLCLERL-SSGKDKNKSV : : : ... ...: ... : . ... :.: : :. .::. : ..:.. .. : CCDS74 QENGQDDTSK--ADKPKVDEEG----DENEDDKDYHRSDPQIAICLDCLRNNGQSGDNVV 110 120 130 140 150 180 190 200 210 220 230 pF1KE3 --LQNKYVRCSVRAEVRHLRRVLCHRLMLNPQHVQL--LFDNEVLPDHMTMKQIWLSRWF :..:..:::.:. : ... : .: : :. .: : ..:.. ::. :...:: CCDS74 KGLMKKFIRCSTRVTVGTIKKFLSLKLKL-PSSYELDVLCNGEIMGKDHTMEFIYMTRWR 160 170 180 190 200 210 240 pF1KE3 GKPSPLLLQYSVKEKRR CCDS74 LRGENFRCLNCSASQVCSQDGPLYQSYPMVLQYRPRIDFG 220 230 240 250 >>CCDS3339.2 PCGF3 gene_id:10336|Hs108|chr4 (242 aa) initn: 612 init1: 448 opt: 448 Z-score: 438.7 bits: 88.6 E(32554): 4.1e-18 Smith-Waterman score: 599; 40.8% identity (69.3% similar) in 238 aa overlap (23-243:5-238) 10 20 30 40 50 60 pF1KE3 MRLRNQLQSVYKMDPLRNEEEVRVKIKDLNEHIVCCLCAGYFVDATTITECLHTFCKSCI ..:. :.: ::.: ::.::..::::.::::::::.::. CCDS33 MLTRKIKLWDINAHITCRLCSGYLIDATTVTECLHTFCRSCL 10 20 30 40 70 80 90 100 110 120 pF1KE3 VKYLQTSKYCPMCNIKIHETQPLLNLKLDRVMQDIVYKLVPGLQDSEEKRIREFYQSRGL ::::. .. :: : : ::...:: . ::.:::::::::::::..: .. ::::.. :. CCDS33 VKYLEENNTCPTCRIVIHQSHPLQYIGHDRTMQDIVYKLVPGLQEAEMRKQREFYHKLGM 50 60 70 80 90 100 130 140 150 160 pF1KE3 DRVTQPTGE----EPALSNLGLPFSSFDHSKAH------------YYRYDEQLNLCLERL . . :: . :.. .. : :. . :.: :::...::: CCDS33 EVPGDIKGETCSAKQHLDSHRNGETKADDSSNKEAAEEKPEEDNDYHRSDEQVSICLE-C 110 120 130 140 150 160 170 180 190 200 210 220 pF1KE3 SSGKDKNKSVLQNKYVRCSVRAEVRHLRRVLCHRLMLNP-QHVQLLFDNEVLPDHMTMKQ .:.: .. :. :..:::..: : ::.. . ..: :. .....: ..:.: :.: CCDS33 NSSKLRG---LKRKWIRCSAQATVLHLKKFIAKKLNLSSFNELDILCNEEILGKDHTLKF 170 180 190 200 210 230 240 pF1KE3 IWLSRWFGKPSPLLLQYSVKEKRR . ..:: : .::::.: : CCDS33 VVVTRWRFKKAPLLLHYRPKMDLL 220 230 240 >>CCDS7546.1 PCGF6 gene_id:84108|Hs108|chr10 (275 aa) initn: 325 init1: 307 opt: 310 Z-score: 308.0 bits: 64.6 E(32554): 7.7e-11 Smith-Waterman score: 310; 41.1% identity (72.3% similar) in 112 aa overlap (18-125:117-228) 10 20 30 40 pF1KE3 MRLRNQLQSVYKMDPLRNEEEVRVKIKDLNEHIVCCLCAGYFVDATT .::: .....:. .:.: .: ::..:::: CCDS75 EEELEEEEEEEEEDMSHFSLRLEGGRQDSEDEEERLINLSELTPYILCSICKGYLIDATT 90 100 110 120 130 140 50 60 70 80 90 100 pF1KE3 ITECLHTFCKSCIVKYLQTSKYCPMCNIKIHETQPLLNLKLDRV---MQDIVYKLVPGLQ ::::::::::::::... :. :: ::: .:.:::: :.. .. .. . :.: CCDS75 ITECLHTFCKSCIVRHFYYSNRCPKCNIVVHQTQPLYNISANEGTGHFKPLEKKFVRVSG 150 160 170 180 190 200 110 120 130 140 150 160 pF1KE3 DSEEKRIREFYQSR-GLDRVTQPTGEEPALSNLGLPFSSFDHSKAHYYRYDEQLNLCLER .. ....: . . ::: . : CCDS75 EATIGHVEKFLRRKMGLDPACQVDIICGDHLLEQYQTLREIRRAIGDAAMQDGLLVLHYG 210 220 230 240 250 260 247 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 08:25:58 2016 done: Sun Nov 6 08:25:58 2016 Total Scan time: 1.980 Total Display time: 0.000 Function used was FASTA [36.3.4 Apr, 2011]