FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE4031, 242 aa
1>>>pF1KE4031 242 - 242 aa - 242 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.9618+/-0.000982; mu= 7.6169+/- 0.059
mean_var=145.6224+/-30.398, 0's: 0 Z-trim(109.2): 83 B-trim: 0 in 0/50
Lambda= 0.106282
statistics sampled from 10648 (10722) to 10648 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.704), E-opt: 0.2 (0.329), width: 16
Scan time: 2.240
The best scores are: opt bits E(32554)
CCDS3339.2 PCGF3 gene_id:10336|Hs108|chr4 ( 242) 1657 265.3 2.6e-71
CCDS1946.2 PCGF1 gene_id:84759|Hs108|chr2 ( 259) 448 80.0 1.7e-15
CCDS32638.1 PCGF2 gene_id:7703|Hs108|chr17 ( 344) 426 76.7 2.2e-14
CCDS7138.1 BMI1 gene_id:648|Hs108|chr10 ( 326) 415 75.0 6.8e-14
CCDS59213.1 BMI1 gene_id:100532731|Hs108|chr10 ( 469) 415 75.1 9e-14
CCDS31275.1 PCGF6 gene_id:84108|Hs108|chr10 ( 350) 411 74.4 1.1e-13
CCDS7413.1 PCGF5 gene_id:84333|Hs108|chr10 ( 256) 382 69.8 1.9e-12
>>CCDS3339.2 PCGF3 gene_id:10336|Hs108|chr4 (242 aa)
initn: 1657 init1: 1657 opt: 1657 Z-score: 1393.8 bits: 265.3 E(32554): 2.6e-71
Smith-Waterman score: 1657; 100.0% identity (100.0% similar) in 242 aa overlap (1-242:1-242)
10 20 30 40 50 60
pF1KE4 MLTRKIKLWDINAHITCRLCSGYLIDATTVTECLHTFCRSCLVKYLEENNTCPTCRIVIH
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 MLTRKIKLWDINAHITCRLCSGYLIDATTVTECLHTFCRSCLVKYLEENNTCPTCRIVIH
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE4 QSHPLQYIGHDRTMQDIVYKLVPGLQEAEMRKQREFYHKLGMEVPGDIKGETCSAKQHLD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 QSHPLQYIGHDRTMQDIVYKLVPGLQEAEMRKQREFYHKLGMEVPGDIKGETCSAKQHLD
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE4 SHRNGETKADDSSNKEAAEEKPEEDNDYHRSDEQVSICLECNSSKLRGLKRKWIRCSAQA
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 SHRNGETKADDSSNKEAAEEKPEEDNDYHRSDEQVSICLECNSSKLRGLKRKWIRCSAQA
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE4 TVLHLKKFIAKKLNLSSFNELDILCNEEILGKDHTLKFVVVTRWRFKKAPLLLHYRPKMD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS33 TVLHLKKFIAKKLNLSSFNELDILCNEEILGKDHTLKFVVVTRWRFKKAPLLLHYRPKMD
190 200 210 220 230 240
pF1KE4 LL
::
CCDS33 LL
>>CCDS1946.2 PCGF1 gene_id:84759|Hs108|chr2 (259 aa)
initn: 612 init1: 448 opt: 448 Z-score: 391.5 bits: 80.0 E(32554): 1.7e-15
Smith-Waterman score: 599; 40.8% identity (69.3% similar) in 238 aa overlap (5-238:35-255)
10 20 30
pF1KE4 MLTRKIKLWDINAHITCRLCSGYLIDATTVTECL
..:. :.: ::.: ::.::..::::.::::
CCDS19 QGGQIAIAMRLRNQLQSVYKMDPLRNEEEVRVKIKDLNEHIVCCLCAGYFVDATTITECL
10 20 30 40 50 60
40 50 60 70 80 90
pF1KE4 HTFCRSCLVKYLEENNTCPTCRIVIHQSHPLQYIGHDRTMQDIVYKLVPGLQEAEMRKQR
::::.::.::::. .. :: : : ::...:: . ::.:::::::::::::..: .. :
CCDS19 HTFCKSCIVKYLQTSKYCPMCNIKIHETQPLLNLKLDRVMQDIVYKLVPGLQDSEEKRIR
70 80 90 100 110 120
100 110 120 130 140 150
pF1KE4 EFYHKLGMEVPGDIKGETCSAKQHLDSHRNGETKADDSSNKEAAEEKPEEDNDYHRSDEQ
:::.. :.. . :: . :.. .. : :. . :.: :::
CCDS19 EFYQSRGLDRVTQPTGE----EPALSNLGLPFSSFDHSKAH------------YYRYDEQ
130 140 150 160
160 170 180 190 200 210
pF1KE4 VSICLE-CNSSKLRG---LKRKWIRCSAQATVLHLKKFIAKKLNLSSFNELDILCNEEIL
...::: .:.: .. :. :..:::..: : ::.. . ..: :. .....: ..:.:
CCDS19 LNLCLERLSSGKDKNKSVLQNKYVRCSVRAEVRHLRRVLCHRLMLNP-QHVQLLFDNEVL
170 180 190 200 210 220
220 230 240
pF1KE4 GKDHTLKFVVVTRWRFKKAPLLLHYRPKMDLL
:.: . ..:: : .::::.: :
CCDS19 PDHMTMKQIWLSRWFGKPSPLLLQYSVKEKRR
230 240 250
>>CCDS32638.1 PCGF2 gene_id:7703|Hs108|chr17 (344 aa)
initn: 530 init1: 419 opt: 426 Z-score: 371.7 bits: 76.7 E(32554): 2.2e-14
Smith-Waterman score: 528; 36.4% identity (66.9% similar) in 236 aa overlap (3-236:4-228)
10 20 30 40 50
pF1KE4 MLTRKIKLWDINAHITCRLCSGYLIDATTVTECLHTFCRSCLVKYLEENNTCPTCRIVI
: .::. ..: :. : ::.::.:::::..::::.::..:.:.::: :. :: : . .
CCDS32 MHRTTRIKITELNPHLMCALCGGYFIDATTIVECLHSFCKTCIVRYLETNKYCPMCDVQV
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE4 HQSHPLQYIGHDRTMQDIVYKLVPGLQEAEMRKQREFYHKLGM-EVPGDIKGETCSAKQH
:...:: : :.:.::::::::::: . ::...:.:: . :::. : . . .
CCDS32 HKTRPLLSIRSDKTLQDIVYKLVPGLFKDEMKRRRDFYAAYPLTEVPN---GSNEDRGEV
70 80 90 100 110
120 130 140 150 160 170
pF1KE4 LDSHRNGETKADDSSNKEAAEEKPEEDNDYHRSDEQVSICLECNSSKLRGLKRKWIRCSA
:.... : . :. . . .: : ... :: ... . ...:: :
CCDS32 LEQEK-GALSDDEIVSLSIEFYEGARDRDEKKGP------LENGDGDKEKTGVRFLRCPA
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE4 QATVLHLKKFIAKKLNLSSFNELDILCNEEILGKDHTL-KFVVVTRWRFKKAPLLLHYRP
::.:: ::. .:... : ....: ..: : . .:: .. . :: ...:: :.::
CCDS32 AMTVMHLAKFLRNKMDVPSKYKVEVLYEDEPLKEYYTLMDIAYIYPWR-RNGPLPLKYRV
180 190 200 210 220
240
pF1KE4 KMDLL
CCDS32 QPACKRLTLATVPTPSEGTNTSGASECESVSDKAPSPATLPATSSSLPSPATPSHGSPSS
230 240 250 260 270 280
>>CCDS7138.1 BMI1 gene_id:648|Hs108|chr10 (326 aa)
initn: 558 init1: 412 opt: 415 Z-score: 362.9 bits: 75.0 E(32554): 6.8e-14
Smith-Waterman score: 524; 36.6% identity (66.0% similar) in 238 aa overlap (3-236:4-226)
10 20 30 40 50
pF1KE4 MLTRKIKLWDINAHITCRLCSGYLIDATTVTECLHTFCRSCLVKYLEENNTCPTCRIVI
: .::. ..: :. : ::.::.:::::. ::::.::..:.:.::: .. :: : . .
CCDS71 MHRTTRIKITELNPHLMCVLCGGYFIDATTIIECLHSFCKTCIVRYLETSKYCPICDVQV
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE4 HQSHPLQYIGHDRTMQDIVYKLVPGLQEAEMRKQREFYHKLGMEVPGDIKGETCSAKQHL
:...:: : :.:.::::::::::: . ::...:.:: . .: .
CCDS71 HKTRPLLNIRSDKTLQDIVYKLVPGLFKNEMKRRRDFY----------AAHPSADAANGS
70 80 90 100 110
120 130 140 150 160 170
pF1KE4 DSHRNGETKADDS---SNKEAAEEKPEEDNDYHRSDEQVSICLECNSSKLRGLKRKWIRC
. : ::. .:. .. : . : : .: :..:. . ..:: . ....::
CCDS71 NEDR-GEVADEDKRIITDDEIISLSIEF-FDQNRLDRKVN--KDKEKSKEEVNDKRYLRC
120 130 140 150 160
180 190 200 210 220 230
pF1KE4 SAQATVLHLKKFIAKKLNLSSFNELDILCNEEILGKDHTL-KFVVVTRWRFKKAPLLLHY
: ::.::.::. .:... . ..:.. .:: : .:: .. . :: ...:: :.:
CCDS71 PAAMTVMHLRKFLRSKMDIPNTFQIDVMYEEEPLKDYYTLMDIAYIYTWR-RNGPLPLKY
170 180 190 200 210 220
240
pF1KE4 RPKMDLL
:
CCDS71 RVRPTCKRMKISHQRDGLTNAGELESDSGSDKANSPAGGIPSTSSCLPSPSTPVQSPHPQ
230 240 250 260 270 280
>>CCDS59213.1 BMI1 gene_id:100532731|Hs108|chr10 (469 aa)
initn: 558 init1: 412 opt: 415 Z-score: 360.8 bits: 75.1 E(32554): 9e-14
Smith-Waterman score: 524; 36.6% identity (66.0% similar) in 238 aa overlap (3-236:147-369)
10 20 30
pF1KE4 MLTRKIKLWDINAHITCRLCSGYLIDATTVTE
: .::. ..: :. : ::.::.:::::. :
CCDS59 RTLIPHPIQRLVLVAAWNNYRIFYQAEMHRTTRIKITELNPHLMCVLCGGYFIDATTIIE
120 130 140 150 160 170
40 50 60 70 80 90
pF1KE4 CLHTFCRSCLVKYLEENNTCPTCRIVIHQSHPLQYIGHDRTMQDIVYKLVPGLQEAEMRK
:::.::..:.:.::: .. :: : . .:...:: : :.:.::::::::::: . ::..
CCDS59 CLHSFCKTCIVRYLETSKYCPICDVQVHKTRPLLNIRSDKTLQDIVYKLVPGLFKNEMKR
180 190 200 210 220 230
100 110 120 130 140
pF1KE4 QREFYHKLGMEVPGDIKGETCSAKQHLDSHRNGETKADDS---SNKEAAEEKPEEDNDYH
.:.:: . .: . . : ::. .:. .. : . : : .
CCDS59 RRDFY----------AAHPSADAANGSNEDR-GEVADEDKRIITDDEIISLSIEF-FDQN
240 250 260 270 280
150 160 170 180 190 200
pF1KE4 RSDEQVSICLECNSSKLRGLKRKWIRCSAQATVLHLKKFIAKKLNLSSFNELDILCNEEI
: :..:. . ..:: . ....:: : ::.::.::. .:... . ..:.. .::
CCDS59 RLDRKVN--KDKEKSKEEVNDKRYLRCPAAMTVMHLRKFLRSKMDIPNTFQIDVMYEEEP
290 300 310 320 330 340
210 220 230 240
pF1KE4 LGKDHTL-KFVVVTRWRFKKAPLLLHYRPKMDLL
: .:: .. . :: ...:: :.::
CCDS59 LKDYYTLMDIAYIYTWR-RNGPLPLKYRVRPTCKRMKISHQRDGLTNAGELESDSGSDKA
350 360 370 380 390 400
>>CCDS31275.1 PCGF6 gene_id:84108|Hs108|chr10 (350 aa)
initn: 532 init1: 411 opt: 411 Z-score: 359.1 bits: 74.4 E(32554): 1.1e-13
Smith-Waterman score: 506; 36.3% identity (67.9% similar) in 234 aa overlap (4-235:121-340)
10 20 30
pF1KE4 MLTRKIKLWDINAHITCRLCSGYLIDATTVTEC
: :.: ... .: : .:.::::::::.:::
CCDS31 EEEEEEEEEDMSHFSLRLEGGRQDSEDEEERLINLSELTPYILCSICKGYLIDATTITEC
100 110 120 130 140 150
40 50 60 70 80 90
pF1KE4 LHTFCRSCLVKYLEENNTCPTCRIVIHQSHPLQYIGHDRTMQDIVYKLVPGLQEAEMRKQ
:::::.::.:... .: :: : ::.::..:: : :: .:::::::: .:.: : ...
CCDS31 LHTFCKSCIVRHFYYSNRCPKCNIVVHQTQPLYNIRLDRQLQDIVYKLVINLEEREKKQM
160 170 180 190 200 210
100 110 120 130 140 150
pF1KE4 REFYHKLGMEVPGDIKGETCSAKQHLDSHRNGETKADDSSNKEAAEEKPEEDNDYHRSDE
..::.. :.::: .. : . : .. :. .: . :: : :
CCDS31 HDFYKERGLEVPKP------AVPQPVPSSKGRSKKVLESVFRI----PPELDM----SLL
220 230 240 250
160 170 180 190 200 210
pF1KE4 QVSICLECNSSKLRGLKRKWIRCSAQATVLHLKKFIAKKLNLSSFNELDILCNEEILGKD
: . ...... :..:..: :..::. :..::. .:..:. ..::.:....: .
CCDS31 LEFIGANEGTGHFKPLEKKFVRVSGEATIGHVEKFLRRKMGLDPACQVDIICGDHLLEQY
260 270 280 290 300 310
220 230 240
pF1KE4 HTLKFV--VVTRWRFKKAPLLLHYRPKMDLL
.::. . .. .. . :.:::
CCDS31 QTLREIRRAIGDAAMQDGLLVLHYGLVVSPLKIT
320 330 340 350
>>CCDS7413.1 PCGF5 gene_id:84333|Hs108|chr10 (256 aa)
initn: 739 init1: 376 opt: 382 Z-score: 336.9 bits: 69.8 E(32554): 1.9e-12
Smith-Waterman score: 687; 39.6% identity (68.3% similar) in 268 aa overlap (4-241:5-255)
10 20 30 40 50
pF1KE4 MLTRKIKLWDINAHITCRLCSGYLIDATTVTECLHTFCRSCLVKYLEENNTCPTCRIVI
:: . :.: .::: .:.:::: :::::::::::..:.:...:..: :: : .
CCDS74 MATQRKHLVKDFNPYITCYICKGYLIKPTTVTECLHTFCKTCIVQHFEDSNDCPRCGNQV
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE4 HQSHPLQYIGHDRTMQDIVYKLVPGLQEAEMRKQREFYHKLGMEVPGDIKGETCSAKQHL
:...::... : :...:..::::::.: :.... ::..: ..
CCDS74 HETNPLEMLRLDNTLEEIIFKLVPGLREQELERESEFWKK----------------NKPQ
70 80 90 100
120 130 140 150 160 170
pF1KE4 DSHRNGETKADDSSNKEAAEEKPEEDNDYHRSDEQVSICLEC--NSSK-----LRGLKRK
.. .. .::: . : ..:. :.:.:::::: :..:::.: :... ..:: .:
CCDS74 ENGQDDTSKADKPKVDEEGDEN-EDDKDYHRSDPQIAICLDCLRNNGQSGDNVVKGLMKK
110 120 130 140 150 160
180 190 200 210 220
pF1KE4 WIRCSAQATVLHLKKFIAKKLNLSSFNELDILCNEEILGKDHTLKFVVVTRWR-------
.::::...:: .:::.. ::.: : :::.::: ::.:::::..:. .::::
CCDS74 FIRCSTRVTVGTIKKFLSLKLKLPSSYELDVLCNGEIMGKDHTMEFIYMTRWRLRGENFR
170 180 190 200 210 220
230 240
pF1KE4 ----------------FKKAPLLLHYRPKMDLL
... :..:.:::..:.
CCDS74 CLNCSASQVCSQDGPLYQSYPMVLQYRPRIDFG
230 240 250
242 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 04:18:18 2016 done: Sun Nov 6 04:18:19 2016
Total Scan time: 2.240 Total Display time: 0.010
Function used was FASTA [36.3.4 Apr, 2011]