FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4031, 242 aa 1>>>pF1KE4031 242 - 242 aa - 242 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.9618+/-0.000982; mu= 7.6169+/- 0.059 mean_var=145.6224+/-30.398, 0's: 0 Z-trim(109.2): 83 B-trim: 0 in 0/50 Lambda= 0.106282 statistics sampled from 10648 (10722) to 10648 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.704), E-opt: 0.2 (0.329), width: 16 Scan time: 2.240 The best scores are: opt bits E(32554) CCDS3339.2 PCGF3 gene_id:10336|Hs108|chr4 ( 242) 1657 265.3 2.6e-71 CCDS1946.2 PCGF1 gene_id:84759|Hs108|chr2 ( 259) 448 80.0 1.7e-15 CCDS32638.1 PCGF2 gene_id:7703|Hs108|chr17 ( 344) 426 76.7 2.2e-14 CCDS7138.1 BMI1 gene_id:648|Hs108|chr10 ( 326) 415 75.0 6.8e-14 CCDS59213.1 BMI1 gene_id:100532731|Hs108|chr10 ( 469) 415 75.1 9e-14 CCDS31275.1 PCGF6 gene_id:84108|Hs108|chr10 ( 350) 411 74.4 1.1e-13 CCDS7413.1 PCGF5 gene_id:84333|Hs108|chr10 ( 256) 382 69.8 1.9e-12 >>CCDS3339.2 PCGF3 gene_id:10336|Hs108|chr4 (242 aa) initn: 1657 init1: 1657 opt: 1657 Z-score: 1393.8 bits: 265.3 E(32554): 2.6e-71 Smith-Waterman score: 1657; 100.0% identity (100.0% similar) in 242 aa overlap (1-242:1-242) 10 20 30 40 50 60 pF1KE4 MLTRKIKLWDINAHITCRLCSGYLIDATTVTECLHTFCRSCLVKYLEENNTCPTCRIVIH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 MLTRKIKLWDINAHITCRLCSGYLIDATTVTECLHTFCRSCLVKYLEENNTCPTCRIVIH 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 QSHPLQYIGHDRTMQDIVYKLVPGLQEAEMRKQREFYHKLGMEVPGDIKGETCSAKQHLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 QSHPLQYIGHDRTMQDIVYKLVPGLQEAEMRKQREFYHKLGMEVPGDIKGETCSAKQHLD 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 SHRNGETKADDSSNKEAAEEKPEEDNDYHRSDEQVSICLECNSSKLRGLKRKWIRCSAQA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SHRNGETKADDSSNKEAAEEKPEEDNDYHRSDEQVSICLECNSSKLRGLKRKWIRCSAQA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 TVLHLKKFIAKKLNLSSFNELDILCNEEILGKDHTLKFVVVTRWRFKKAPLLLHYRPKMD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 TVLHLKKFIAKKLNLSSFNELDILCNEEILGKDHTLKFVVVTRWRFKKAPLLLHYRPKMD 190 200 210 220 230 240 pF1KE4 LL :: CCDS33 LL >>CCDS1946.2 PCGF1 gene_id:84759|Hs108|chr2 (259 aa) initn: 612 init1: 448 opt: 448 Z-score: 391.5 bits: 80.0 E(32554): 1.7e-15 Smith-Waterman score: 599; 40.8% identity (69.3% similar) in 238 aa overlap (5-238:35-255) 10 20 30 pF1KE4 MLTRKIKLWDINAHITCRLCSGYLIDATTVTECL ..:. :.: ::.: ::.::..::::.:::: CCDS19 QGGQIAIAMRLRNQLQSVYKMDPLRNEEEVRVKIKDLNEHIVCCLCAGYFVDATTITECL 10 20 30 40 50 60 40 50 60 70 80 90 pF1KE4 HTFCRSCLVKYLEENNTCPTCRIVIHQSHPLQYIGHDRTMQDIVYKLVPGLQEAEMRKQR ::::.::.::::. .. :: : : ::...:: . ::.:::::::::::::..: .. : CCDS19 HTFCKSCIVKYLQTSKYCPMCNIKIHETQPLLNLKLDRVMQDIVYKLVPGLQDSEEKRIR 70 80 90 100 110 120 100 110 120 130 140 150 pF1KE4 EFYHKLGMEVPGDIKGETCSAKQHLDSHRNGETKADDSSNKEAAEEKPEEDNDYHRSDEQ :::.. :.. . :: . :.. .. : :. . :.: ::: CCDS19 EFYQSRGLDRVTQPTGE----EPALSNLGLPFSSFDHSKAH------------YYRYDEQ 130 140 150 160 160 170 180 190 200 210 pF1KE4 VSICLE-CNSSKLRG---LKRKWIRCSAQATVLHLKKFIAKKLNLSSFNELDILCNEEIL ...::: .:.: .. :. :..:::..: : ::.. . ..: :. .....: ..:.: CCDS19 LNLCLERLSSGKDKNKSVLQNKYVRCSVRAEVRHLRRVLCHRLMLNP-QHVQLLFDNEVL 170 180 190 200 210 220 220 230 240 pF1KE4 GKDHTLKFVVVTRWRFKKAPLLLHYRPKMDLL :.: . ..:: : .::::.: : CCDS19 PDHMTMKQIWLSRWFGKPSPLLLQYSVKEKRR 230 240 250 >>CCDS32638.1 PCGF2 gene_id:7703|Hs108|chr17 (344 aa) initn: 530 init1: 419 opt: 426 Z-score: 371.7 bits: 76.7 E(32554): 2.2e-14 Smith-Waterman score: 528; 36.4% identity (66.9% similar) in 236 aa overlap (3-236:4-228) 10 20 30 40 50 pF1KE4 MLTRKIKLWDINAHITCRLCSGYLIDATTVTECLHTFCRSCLVKYLEENNTCPTCRIVI : .::. ..: :. : ::.::.:::::..::::.::..:.:.::: :. :: : . . CCDS32 MHRTTRIKITELNPHLMCALCGGYFIDATTIVECLHSFCKTCIVRYLETNKYCPMCDVQV 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE4 HQSHPLQYIGHDRTMQDIVYKLVPGLQEAEMRKQREFYHKLGM-EVPGDIKGETCSAKQH :...:: : :.:.::::::::::: . ::...:.:: . :::. : . . . CCDS32 HKTRPLLSIRSDKTLQDIVYKLVPGLFKDEMKRRRDFYAAYPLTEVPN---GSNEDRGEV 70 80 90 100 110 120 130 140 150 160 170 pF1KE4 LDSHRNGETKADDSSNKEAAEEKPEEDNDYHRSDEQVSICLECNSSKLRGLKRKWIRCSA :.... : . :. . . .: : ... :: ... . ...:: : CCDS32 LEQEK-GALSDDEIVSLSIEFYEGARDRDEKKGP------LENGDGDKEKTGVRFLRCPA 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE4 QATVLHLKKFIAKKLNLSSFNELDILCNEEILGKDHTL-KFVVVTRWRFKKAPLLLHYRP ::.:: ::. .:... : ....: ..: : . .:: .. . :: ...:: :.:: CCDS32 AMTVMHLAKFLRNKMDVPSKYKVEVLYEDEPLKEYYTLMDIAYIYPWR-RNGPLPLKYRV 180 190 200 210 220 240 pF1KE4 KMDLL CCDS32 QPACKRLTLATVPTPSEGTNTSGASECESVSDKAPSPATLPATSSSLPSPATPSHGSPSS 230 240 250 260 270 280 >>CCDS7138.1 BMI1 gene_id:648|Hs108|chr10 (326 aa) initn: 558 init1: 412 opt: 415 Z-score: 362.9 bits: 75.0 E(32554): 6.8e-14 Smith-Waterman score: 524; 36.6% identity (66.0% similar) in 238 aa overlap (3-236:4-226) 10 20 30 40 50 pF1KE4 MLTRKIKLWDINAHITCRLCSGYLIDATTVTECLHTFCRSCLVKYLEENNTCPTCRIVI : .::. ..: :. : ::.::.:::::. ::::.::..:.:.::: .. :: : . . CCDS71 MHRTTRIKITELNPHLMCVLCGGYFIDATTIIECLHSFCKTCIVRYLETSKYCPICDVQV 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE4 HQSHPLQYIGHDRTMQDIVYKLVPGLQEAEMRKQREFYHKLGMEVPGDIKGETCSAKQHL :...:: : :.:.::::::::::: . ::...:.:: . .: . CCDS71 HKTRPLLNIRSDKTLQDIVYKLVPGLFKNEMKRRRDFY----------AAHPSADAANGS 70 80 90 100 110 120 130 140 150 160 170 pF1KE4 DSHRNGETKADDS---SNKEAAEEKPEEDNDYHRSDEQVSICLECNSSKLRGLKRKWIRC . : ::. .:. .. : . : : .: :..:. . ..:: . ....:: CCDS71 NEDR-GEVADEDKRIITDDEIISLSIEF-FDQNRLDRKVN--KDKEKSKEEVNDKRYLRC 120 130 140 150 160 180 190 200 210 220 230 pF1KE4 SAQATVLHLKKFIAKKLNLSSFNELDILCNEEILGKDHTL-KFVVVTRWRFKKAPLLLHY : ::.::.::. .:... . ..:.. .:: : .:: .. . :: ...:: :.: CCDS71 PAAMTVMHLRKFLRSKMDIPNTFQIDVMYEEEPLKDYYTLMDIAYIYTWR-RNGPLPLKY 170 180 190 200 210 220 240 pF1KE4 RPKMDLL : CCDS71 RVRPTCKRMKISHQRDGLTNAGELESDSGSDKANSPAGGIPSTSSCLPSPSTPVQSPHPQ 230 240 250 260 270 280 >>CCDS59213.1 BMI1 gene_id:100532731|Hs108|chr10 (469 aa) initn: 558 init1: 412 opt: 415 Z-score: 360.8 bits: 75.1 E(32554): 9e-14 Smith-Waterman score: 524; 36.6% identity (66.0% similar) in 238 aa overlap (3-236:147-369) 10 20 30 pF1KE4 MLTRKIKLWDINAHITCRLCSGYLIDATTVTE : .::. ..: :. : ::.::.:::::. : CCDS59 RTLIPHPIQRLVLVAAWNNYRIFYQAEMHRTTRIKITELNPHLMCVLCGGYFIDATTIIE 120 130 140 150 160 170 40 50 60 70 80 90 pF1KE4 CLHTFCRSCLVKYLEENNTCPTCRIVIHQSHPLQYIGHDRTMQDIVYKLVPGLQEAEMRK :::.::..:.:.::: .. :: : . .:...:: : :.:.::::::::::: . ::.. CCDS59 CLHSFCKTCIVRYLETSKYCPICDVQVHKTRPLLNIRSDKTLQDIVYKLVPGLFKNEMKR 180 190 200 210 220 230 100 110 120 130 140 pF1KE4 QREFYHKLGMEVPGDIKGETCSAKQHLDSHRNGETKADDS---SNKEAAEEKPEEDNDYH .:.:: . .: . . : ::. .:. .. : . : : . CCDS59 RRDFY----------AAHPSADAANGSNEDR-GEVADEDKRIITDDEIISLSIEF-FDQN 240 250 260 270 280 150 160 170 180 190 200 pF1KE4 RSDEQVSICLECNSSKLRGLKRKWIRCSAQATVLHLKKFIAKKLNLSSFNELDILCNEEI : :..:. . ..:: . ....:: : ::.::.::. .:... . ..:.. .:: CCDS59 RLDRKVN--KDKEKSKEEVNDKRYLRCPAAMTVMHLRKFLRSKMDIPNTFQIDVMYEEEP 290 300 310 320 330 340 210 220 230 240 pF1KE4 LGKDHTL-KFVVVTRWRFKKAPLLLHYRPKMDLL : .:: .. . :: ...:: :.:: CCDS59 LKDYYTLMDIAYIYTWR-RNGPLPLKYRVRPTCKRMKISHQRDGLTNAGELESDSGSDKA 350 360 370 380 390 400 >>CCDS31275.1 PCGF6 gene_id:84108|Hs108|chr10 (350 aa) initn: 532 init1: 411 opt: 411 Z-score: 359.1 bits: 74.4 E(32554): 1.1e-13 Smith-Waterman score: 506; 36.3% identity (67.9% similar) in 234 aa overlap (4-235:121-340) 10 20 30 pF1KE4 MLTRKIKLWDINAHITCRLCSGYLIDATTVTEC : :.: ... .: : .:.::::::::.::: CCDS31 EEEEEEEEEDMSHFSLRLEGGRQDSEDEEERLINLSELTPYILCSICKGYLIDATTITEC 100 110 120 130 140 150 40 50 60 70 80 90 pF1KE4 LHTFCRSCLVKYLEENNTCPTCRIVIHQSHPLQYIGHDRTMQDIVYKLVPGLQEAEMRKQ :::::.::.:... .: :: : ::.::..:: : :: .:::::::: .:.: : ... CCDS31 LHTFCKSCIVRHFYYSNRCPKCNIVVHQTQPLYNIRLDRQLQDIVYKLVINLEEREKKQM 160 170 180 190 200 210 100 110 120 130 140 150 pF1KE4 REFYHKLGMEVPGDIKGETCSAKQHLDSHRNGETKADDSSNKEAAEEKPEEDNDYHRSDE ..::.. :.::: .. : . : .. :. .: . :: : : CCDS31 HDFYKERGLEVPKP------AVPQPVPSSKGRSKKVLESVFRI----PPELDM----SLL 220 230 240 250 160 170 180 190 200 210 pF1KE4 QVSICLECNSSKLRGLKRKWIRCSAQATVLHLKKFIAKKLNLSSFNELDILCNEEILGKD : . ...... :..:..: :..::. :..::. .:..:. ..::.:....: . CCDS31 LEFIGANEGTGHFKPLEKKFVRVSGEATIGHVEKFLRRKMGLDPACQVDIICGDHLLEQY 260 270 280 290 300 310 220 230 240 pF1KE4 HTLKFV--VVTRWRFKKAPLLLHYRPKMDLL .::. . .. .. . :.::: CCDS31 QTLREIRRAIGDAAMQDGLLVLHYGLVVSPLKIT 320 330 340 350 >>CCDS7413.1 PCGF5 gene_id:84333|Hs108|chr10 (256 aa) initn: 739 init1: 376 opt: 382 Z-score: 336.9 bits: 69.8 E(32554): 1.9e-12 Smith-Waterman score: 687; 39.6% identity (68.3% similar) in 268 aa overlap (4-241:5-255) 10 20 30 40 50 pF1KE4 MLTRKIKLWDINAHITCRLCSGYLIDATTVTECLHTFCRSCLVKYLEENNTCPTCRIVI :: . :.: .::: .:.:::: :::::::::::..:.:...:..: :: : . CCDS74 MATQRKHLVKDFNPYITCYICKGYLIKPTTVTECLHTFCKTCIVQHFEDSNDCPRCGNQV 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE4 HQSHPLQYIGHDRTMQDIVYKLVPGLQEAEMRKQREFYHKLGMEVPGDIKGETCSAKQHL :...::... : :...:..::::::.: :.... ::..: .. CCDS74 HETNPLEMLRLDNTLEEIIFKLVPGLREQELERESEFWKK----------------NKPQ 70 80 90 100 120 130 140 150 160 170 pF1KE4 DSHRNGETKADDSSNKEAAEEKPEEDNDYHRSDEQVSICLEC--NSSK-----LRGLKRK .. .. .::: . : ..:. :.:.:::::: :..:::.: :... ..:: .: CCDS74 ENGQDDTSKADKPKVDEEGDEN-EDDKDYHRSDPQIAICLDCLRNNGQSGDNVVKGLMKK 110 120 130 140 150 160 180 190 200 210 220 pF1KE4 WIRCSAQATVLHLKKFIAKKLNLSSFNELDILCNEEILGKDHTLKFVVVTRWR------- .::::...:: .:::.. ::.: : :::.::: ::.:::::..:. .:::: CCDS74 FIRCSTRVTVGTIKKFLSLKLKLPSSYELDVLCNGEIMGKDHTMEFIYMTRWRLRGENFR 170 180 190 200 210 220 230 240 pF1KE4 ----------------FKKAPLLLHYRPKMDLL ... :..:.:::..:. CCDS74 CLNCSASQVCSQDGPLYQSYPMVLQYRPRIDFG 230 240 250 242 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 04:18:18 2016 done: Sun Nov 6 04:18:19 2016 Total Scan time: 2.240 Total Display time: 0.010 Function used was FASTA [36.3.4 Apr, 2011]