FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE3975, 247 aa
1>>>pF1KE3975 247 - 247 aa - 247 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.0081+/-0.000963; mu= 11.8507+/- 0.058
mean_var=112.7930+/-22.947, 0's: 0 Z-trim(108.4): 114 B-trim: 0 in 0/51
Lambda= 0.120763
statistics sampled from 10022 (10157) to 10022 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.7), E-opt: 0.2 (0.312), width: 16
Scan time: 1.980
The best scores are: opt bits E(32554)
CCDS1946.2 PCGF1 gene_id:84759|Hs108|chr2 ( 259) 1693 305.6 2.2e-83
CCDS7138.1 BMI1 gene_id:648|Hs108|chr10 ( 326) 571 110.2 1.8e-24
CCDS59213.1 BMI1 gene_id:100532731|Hs108|chr10 ( 469) 571 110.3 2.3e-24
CCDS32638.1 PCGF2 gene_id:7703|Hs108|chr17 ( 344) 543 105.3 5.5e-23
CCDS31275.1 PCGF6 gene_id:84108|Hs108|chr10 ( 350) 524 102.0 5.5e-22
CCDS7413.1 PCGF5 gene_id:84333|Hs108|chr10 ( 256) 504 98.4 4.9e-21
CCDS3339.2 PCGF3 gene_id:10336|Hs108|chr4 ( 242) 448 88.6 4.1e-18
CCDS7546.1 PCGF6 gene_id:84108|Hs108|chr10 ( 275) 310 64.6 7.7e-11
>>CCDS1946.2 PCGF1 gene_id:84759|Hs108|chr2 (259 aa)
initn: 1693 init1: 1693 opt: 1693 Z-score: 1610.6 bits: 305.6 E(32554): 2.2e-83
Smith-Waterman score: 1693; 100.0% identity (100.0% similar) in 247 aa overlap (1-247:13-259)
10 20 30 40
pF1KE3 MRLRNQLQSVYKMDPLRNEEEVRVKIKDLNEHIVCCLCAGYFVDATTI
::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 MASPQGGQIAIAMRLRNQLQSVYKMDPLRNEEEVRVKIKDLNEHIVCCLCAGYFVDATTI
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE3 TECLHTFCKSCIVKYLQTSKYCPMCNIKIHETQPLLNLKLDRVMQDIVYKLVPGLQDSEE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 TECLHTFCKSCIVKYLQTSKYCPMCNIKIHETQPLLNLKLDRVMQDIVYKLVPGLQDSEE
70 80 90 100 110 120
110 120 130 140 150 160
pF1KE3 KRIREFYQSRGLDRVTQPTGEEPALSNLGLPFSSFDHSKAHYYRYDEQLNLCLERLSSGK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 KRIREFYQSRGLDRVTQPTGEEPALSNLGLPFSSFDHSKAHYYRYDEQLNLCLERLSSGK
130 140 150 160 170 180
170 180 190 200 210 220
pF1KE3 DKNKSVLQNKYVRCSVRAEVRHLRRVLCHRLMLNPQHVQLLFDNEVLPDHMTMKQIWLSR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS19 DKNKSVLQNKYVRCSVRAEVRHLRRVLCHRLMLNPQHVQLLFDNEVLPDHMTMKQIWLSR
190 200 210 220 230 240
230 240
pF1KE3 WFGKPSPLLLQYSVKEKRR
:::::::::::::::::::
CCDS19 WFGKPSPLLLQYSVKEKRR
250
>>CCDS7138.1 BMI1 gene_id:648|Hs108|chr10 (326 aa)
initn: 511 init1: 478 opt: 571 Z-score: 552.8 bits: 110.2 E(32554): 1.8e-24
Smith-Waterman score: 578; 41.6% identity (70.0% similar) in 233 aa overlap (23-243:6-228)
10 20 30 40 50 60
pF1KE3 MRLRNQLQSVYKMDPLRNEEEVRVKIKDLNEHIVCCLCAGYFVDATTITECLHTFCKSCI
:.:: .:: :..: ::.:::.::::: ::::.:::.::
CCDS71 MHRTTRIKITELNPHLMCVLCGGYFIDATTIIECLHSFCKTCI
10 20 30 40
70 80 90 100 110 120
pF1KE3 VKYLQTSKYCPMCNIKIHETQPLLNLKLDRVMQDIVYKLVPGLQDSEEKRIREFYQSRGL
:.::.::::::.:....:.:.::::.. :...::::::::::: .: :: :.:: .
CCDS71 VRYLETSKYCPICDVQVHKTRPLLNIRSDKTLQDIVYKLVPGLFKNEMKRRRDFYAA---
50 60 70 80 90 100
130 140 150 160 170
pF1KE3 DRVTQPTGEEPALSNLGLPFSSFDHSKAHYYRYDEQLNLCLE-----RLSS--GKDKNKS
.:... :: . :..: . :: ..: .: ::. .:::.::
CCDS71 ----HPSADAANGSNEDRGEVA-DEDK-RIITDDEIISLSIEFFDQNRLDRKVNKDKEKS
110 120 130 140 150
180 190 200 210 220
pF1KE3 ---VLQNKYVRCSVRAEVRHLRRVLCHRLML-NPQHVQLLFDNEVLPDHMTMKQI-WLSR
: ...:.:: . : :::. : .. . : ........: : :..:. .: ..
CCDS71 KEEVNDKRYLRCPAAMTVMHLRKFLRSKMDIPNTFQIDVMYEEEPLKDYYTLMDIAYIYT
160 170 180 190 200 210
230 240
pF1KE3 WFGKPSPLLLQYSVKEKRR
: . .:: :.: :.
CCDS71 WR-RNGPLPLKYRVRPTCKRMKISHQRDGLTNAGELESDSGSDKANSPAGGIPSTSSCLP
220 230 240 250 260 270
>>CCDS59213.1 BMI1 gene_id:100532731|Hs108|chr10 (469 aa)
initn: 511 init1: 478 opt: 571 Z-score: 550.8 bits: 110.3 E(32554): 2.3e-24
Smith-Waterman score: 578; 41.6% identity (70.0% similar) in 233 aa overlap (23-243:149-371)
10 20 30 40 50
pF1KE3 MRLRNQLQSVYKMDPLRNEEEVRVKIKDLNEHIVCCLCAGYFVDATTITECL
:.:: .:: :..: ::.:::.::::: :::
CCDS59 LIPHPIQRLVLVAAWNNYRIFYQAEMHRTTRIKITELNPHLMCVLCGGYFIDATTIIECL
120 130 140 150 160 170
60 70 80 90 100 110
pF1KE3 HTFCKSCIVKYLQTSKYCPMCNIKIHETQPLLNLKLDRVMQDIVYKLVPGLQDSEEKRIR
:.:::.:::.::.::::::.:....:.:.::::.. :...::::::::::: .: :: :
CCDS59 HSFCKTCIVRYLETSKYCPICDVQVHKTRPLLNIRSDKTLQDIVYKLVPGLFKNEMKRRR
180 190 200 210 220 230
120 130 140 150 160
pF1KE3 EFYQSRGLDRVTQPTGEEPALSNLGLPFSSFDHSKAHYYRYDEQLNLCLE-----RLSS-
.:: . .:... :: . :..: . :: ..: .: ::.
CCDS59 DFYAA-------HPSADAANGSNEDRGEVA-DEDK-RIITDDEIISLSIEFFDQNRLDRK
240 250 260 270 280
170 180 190 200 210 220
pF1KE3 -GKDKNKS---VLQNKYVRCSVRAEVRHLRRVLCHRLML-NPQHVQLLFDNEVLPDHMTM
.:::.:: : ...:.:: . : :::. : .. . : ........: : :..:.
CCDS59 VNKDKEKSKEEVNDKRYLRCPAAMTVMHLRKFLRSKMDIPNTFQIDVMYEEEPLKDYYTL
290 300 310 320 330 340
230 240
pF1KE3 KQI-WLSRWFGKPSPLLLQYSVKEKRR
.: .. : . .:: :.: :.
CCDS59 MDIAYIYTWR-RNGPLPLKYRVRPTCKRMKISHQRDGLTNAGELESDSGSDKANSPAGGI
350 360 370 380 390 400
>>CCDS32638.1 PCGF2 gene_id:7703|Hs108|chr17 (344 aa)
initn: 513 init1: 486 opt: 543 Z-score: 526.2 bits: 105.3 E(32554): 5.5e-23
Smith-Waterman score: 552; 38.3% identity (69.8% similar) in 235 aa overlap (23-243:6-230)
10 20 30 40 50 60
pF1KE3 MRLRNQLQSVYKMDPLRNEEEVRVKIKDLNEHIVCCLCAGYFVDATTITECLHTFCKSCI
:.:: .:: :..: ::.:::.:::::.::::.:::.::
CCDS32 MHRTTRIKITELNPHLMCALCGGYFIDATTIVECLHSFCKTCI
10 20 30 40
70 80 90 100 110 120
pF1KE3 VKYLQTSKYCPMCNIKIHETQPLLNLKLDRVMQDIVYKLVPGLQDSEEKRIREFYQSRGL
:.::.:.::::::....:.:.:::... :...::::::::::: .: :: :.:: . :
CCDS32 VRYLETNKYCPMCDVQVHKTRPLLSIRSDKTLQDIVYKLVPGLFKDEMKRRRDFYAAYPL
50 60 70 80 90 100
130 140 150 160 170
pF1KE3 DRVTQPTGEEPALSNLGLPFSSFDHSKAHYYRYDEQLNLCLERLSSGKDKN--KSVLQN-
.: :.: . ... ... :. :: ..: .: ...:.. :. :.:
CCDS32 TEV--PNGSNEDRGEV------LEQEKGALSD-DEIVSLSIEFYEGARDRDEKKGPLENG
110 120 130 140 150
180 190 200 210 220
pF1KE3 ---------KYVRCSVRAEVRHLRRVLCHRLMLNPQH-VQLLFDNEVLPDHMTMKQI-WL
...:: . : :: . : ... . .. :..:...: : ...:. .: ..
CCDS32 DGDKEKTGVRFLRCPAAMTVMHLAKFLRNKMDVPSKYKVEVLYEDEPLKEYYTLMDIAYI
160 170 180 190 200 210
230 240
pF1KE3 SRWFGKPSPLLLQYSVKEKRR
: . .:: :.: :.
CCDS32 YPWR-RNGPLPLKYRVQPACKRLTLATVPTPSEGTNTSGASECESVSDKAPSPATLPATS
220 230 240 250 260 270
>>CCDS31275.1 PCGF6 gene_id:84108|Hs108|chr10 (350 aa)
initn: 443 init1: 443 opt: 524 Z-score: 508.2 bits: 102.0 E(32554): 5.5e-22
Smith-Waterman score: 524; 38.9% identity (74.4% similar) in 211 aa overlap (18-224:117-322)
10 20 30 40
pF1KE3 MRLRNQLQSVYKMDPLRNEEEVRVKIKDLNEHIVCCLCAGYFVDATT
.::: .....:. .:.: .: ::..::::
CCDS31 EEELEEEEEEEEEDMSHFSLRLEGGRQDSEDEEERLINLSELTPYILCSICKGYLIDATT
90 100 110 120 130 140
50 60 70 80 90 100
pF1KE3 ITECLHTFCKSCIVKYLQTSKYCPMCNIKIHETQPLLNLKLDRVMQDIVYKLVPGLQDSE
::::::::::::::... :. :: ::: .:.:::: :..::: .:::::::: .:.. :
CCDS31 ITECLHTFCKSCIVRHFYYSNRCPKCNIVVHQTQPLYNIRLDRQLQDIVYKLVINLEERE
150 160 170 180 190 200
110 120 130 140 150 160
pF1KE3 EKRIREFYQSRGLDRVTQPTGEEPALSNLGLPFSSFDHSKAHYYRYDEQLN--LCLERLS
.:....::. :::. : .:. .:. :. : . .. .: .:. : :: ..
CCDS31 KKQMHDFYKERGLE-VPKPAVPQPVPSSKGRSKKVLES----VFRIPPELDMSLLLEFIG
210 220 230 240 250 260
170 180 190 200 210 220
pF1KE3 SGKDKNK-SVLQNKYVRCSVRAEVRHLRRVLCHRLMLNPQ-HVQLLFDNEVLPDHMTMKQ
... .. . :..:.:: : .: . :... : ... :.: .:... ...: ...:...
CCDS31 ANEGTGHFKPLEKKFVRVSGEATIGHVEKFLRRKMGLDPACQVDIICGDHLLEQYQTLRE
270 280 290 300 310 320
230 240
pF1KE3 IWLSRWFGKPSPLLLQYSVKEKRR
:
CCDS31 IRRAIGDAAMQDGLLVLHYGLVVSPLKIT
330 340 350
>>CCDS7413.1 PCGF5 gene_id:84333|Hs108|chr10 (256 aa)
initn: 462 init1: 363 opt: 504 Z-score: 491.1 bits: 98.4 E(32554): 4.9e-21
Smith-Waterman score: 504; 36.4% identity (70.6% similar) in 214 aa overlap (26-229:9-215)
10 20 30 40 50 60
pF1KE3 MRLRNQLQSVYKMDPLRNEEEVRVKIKDLNEHIVCCLCAGYFVDATTITECLHTFCKSCI
.::.: .:.: .: ::.. ::.:::::::::.::
CCDS74 MATQRKHLVKDFNPYITCYICKGYLIKPTTVTECLHTFCKTCI
10 20 30 40
70 80 90 100 110
pF1KE3 VKYLQTSKYCPMCNIKIHETQPLLNLKLDRVMQDIVYKLVPGLQDSEEKRIREFY-----
:.... :. :: :. ..:::.:: :.:: ....:..::::::...: .: ::.
CCDS74 VQHFEDSNDCPRCGNQVHETNPLEMLRLDNTLEEIIFKLVPGLREQELERESEFWKKNKP
50 60 70 80 90 100
120 130 140 150 160 170
pF1KE3 QSRGLDRVTQPTGEEPALSNLGLPFSSFDHSKAHYYRYDEQLNLCLERL-SSGKDKNKSV
: : : ... ...: ... : . ... :.: : :. .::. : ..:.. .. :
CCDS74 QENGQDDTSK--ADKPKVDEEG----DENEDDKDYHRSDPQIAICLDCLRNNGQSGDNVV
110 120 130 140 150
180 190 200 210 220 230
pF1KE3 --LQNKYVRCSVRAEVRHLRRVLCHRLMLNPQHVQL--LFDNEVLPDHMTMKQIWLSRWF
:..:..:::.:. : ... : .: : :. .: : ..:.. ::. :...::
CCDS74 KGLMKKFIRCSTRVTVGTIKKFLSLKLKL-PSSYELDVLCNGEIMGKDHTMEFIYMTRWR
160 170 180 190 200 210
240
pF1KE3 GKPSPLLLQYSVKEKRR
CCDS74 LRGENFRCLNCSASQVCSQDGPLYQSYPMVLQYRPRIDFG
220 230 240 250
>>CCDS3339.2 PCGF3 gene_id:10336|Hs108|chr4 (242 aa)
initn: 612 init1: 448 opt: 448 Z-score: 438.7 bits: 88.6 E(32554): 4.1e-18
Smith-Waterman score: 599; 40.8% identity (69.3% similar) in 238 aa overlap (23-243:5-238)
10 20 30 40 50 60
pF1KE3 MRLRNQLQSVYKMDPLRNEEEVRVKIKDLNEHIVCCLCAGYFVDATTITECLHTFCKSCI
..:. :.: ::.: ::.::..::::.::::::::.::.
CCDS33 MLTRKIKLWDINAHITCRLCSGYLIDATTVTECLHTFCRSCL
10 20 30 40
70 80 90 100 110 120
pF1KE3 VKYLQTSKYCPMCNIKIHETQPLLNLKLDRVMQDIVYKLVPGLQDSEEKRIREFYQSRGL
::::. .. :: : : ::...:: . ::.:::::::::::::..: .. ::::.. :.
CCDS33 VKYLEENNTCPTCRIVIHQSHPLQYIGHDRTMQDIVYKLVPGLQEAEMRKQREFYHKLGM
50 60 70 80 90 100
130 140 150 160
pF1KE3 DRVTQPTGE----EPALSNLGLPFSSFDHSKAH------------YYRYDEQLNLCLERL
. . :: . :.. .. : :. . :.: :::...:::
CCDS33 EVPGDIKGETCSAKQHLDSHRNGETKADDSSNKEAAEEKPEEDNDYHRSDEQVSICLE-C
110 120 130 140 150 160
170 180 190 200 210 220
pF1KE3 SSGKDKNKSVLQNKYVRCSVRAEVRHLRRVLCHRLMLNP-QHVQLLFDNEVLPDHMTMKQ
.:.: .. :. :..:::..: : ::.. . ..: :. .....: ..:.: :.:
CCDS33 NSSKLRG---LKRKWIRCSAQATVLHLKKFIAKKLNLSSFNELDILCNEEILGKDHTLKF
170 180 190 200 210
230 240
pF1KE3 IWLSRWFGKPSPLLLQYSVKEKRR
. ..:: : .::::.: :
CCDS33 VVVTRWRFKKAPLLLHYRPKMDLL
220 230 240
>>CCDS7546.1 PCGF6 gene_id:84108|Hs108|chr10 (275 aa)
initn: 325 init1: 307 opt: 310 Z-score: 308.0 bits: 64.6 E(32554): 7.7e-11
Smith-Waterman score: 310; 41.1% identity (72.3% similar) in 112 aa overlap (18-125:117-228)
10 20 30 40
pF1KE3 MRLRNQLQSVYKMDPLRNEEEVRVKIKDLNEHIVCCLCAGYFVDATT
.::: .....:. .:.: .: ::..::::
CCDS75 EEELEEEEEEEEEDMSHFSLRLEGGRQDSEDEEERLINLSELTPYILCSICKGYLIDATT
90 100 110 120 130 140
50 60 70 80 90 100
pF1KE3 ITECLHTFCKSCIVKYLQTSKYCPMCNIKIHETQPLLNLKLDRV---MQDIVYKLVPGLQ
::::::::::::::... :. :: ::: .:.:::: :.. .. .. . :.:
CCDS75 ITECLHTFCKSCIVRHFYYSNRCPKCNIVVHQTQPLYNISANEGTGHFKPLEKKFVRVSG
150 160 170 180 190 200
110 120 130 140 150 160
pF1KE3 DSEEKRIREFYQSR-GLDRVTQPTGEEPALSNLGLPFSSFDHSKAHYYRYDEQLNLCLER
.. ....: . . ::: . :
CCDS75 EATIGHVEKFLRRKMGLDPACQVDIICGDHLLEQYQTLREIRRAIGDAAMQDGLLVLHYG
210 220 230 240 250 260
247 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 08:25:58 2016 done: Sun Nov 6 08:25:58 2016
Total Scan time: 1.980 Total Display time: 0.000
Function used was FASTA [36.3.4 Apr, 2011]