FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB6406, 335 aa
1>>>pF1KB6406 335 - 335 aa - 335 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.8271+/-0.00101; mu= 8.4274+/- 0.060
mean_var=84.4227+/-17.703, 0's: 0 Z-trim(104.8): 19 B-trim: 0 in 0/48
Lambda= 0.139587
statistics sampled from 8095 (8104) to 8095 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.618), E-opt: 0.2 (0.249), width: 16
Scan time: 2.540
The best scores are: opt bits E(32554)
CCDS6129.1 POLB gene_id:5423|Hs108|chr8 ( 335) 2196 452.2 2.8e-127
CCDS7513.1 POLL gene_id:27343|Hs108|chr10 ( 575) 653 141.5 1.6e-33
CCDS76332.1 POLL gene_id:27343|Hs108|chr10 ( 300) 622 135.2 6.6e-32
CCDS34625.1 POLM gene_id:27434|Hs108|chr7 ( 494) 346 79.6 5.8e-15
CCDS44465.1 DNTT gene_id:1791|Hs108|chr10 ( 508) 281 66.5 5.2e-11
CCDS7447.1 DNTT gene_id:1791|Hs108|chr10 ( 509) 281 66.5 5.2e-11
>>CCDS6129.1 POLB gene_id:5423|Hs108|chr8 (335 aa)
initn: 2196 init1: 2196 opt: 2196 Z-score: 2398.5 bits: 452.2 E(32554): 2.8e-127
Smith-Waterman score: 2196; 100.0% identity (100.0% similar) in 335 aa overlap (1-335:1-335)
10 20 30 40 50 60
pF1KB6 MSKRKAPQETLNGGITDMLTELANFEKNVSQAIHKYNAYRKAASVIAKYPHKIKSGAEAK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 MSKRKAPQETLNGGITDMLTELANFEKNVSQAIHKYNAYRKAASVIAKYPHKIKSGAEAK
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB6 KLPGVGTKIAEKIDEFLATGKLRKLEKIRQDDTSSSINFLTRVSGIGPSAARKFVDEGIK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 KLPGVGTKIAEKIDEFLATGKLRKLEKIRQDDTSSSINFLTRVSGIGPSAARKFVDEGIK
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB6 TLEDLRKNEDKLNHHQRIGLKYFGDFEKRIPREEMLQMQDIVLNEVKKVDSEYIATVCGS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 TLEDLRKNEDKLNHHQRIGLKYFGDFEKRIPREEMLQMQDIVLNEVKKVDSEYIATVCGS
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB6 FRRGAESSGDMDVLLTHPSFTSESTKQPKLLHQVVEQLQKVHFITDTLSKGETKFMGVCQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 FRRGAESSGDMDVLLTHPSFTSESTKQPKLLHQVVEQLQKVHFITDTLSKGETKFMGVCQ
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB6 LPSKNDEKEYPHRRIDIRLIPKDQYYCGVLYFTGSDIFNKNMRAHALEKGFTINEYTIRP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS61 LPSKNDEKEYPHRRIDIRLIPKDQYYCGVLYFTGSDIFNKNMRAHALEKGFTINEYTIRP
250 260 270 280 290 300
310 320 330
pF1KB6 LGVTGVAGEPLPVDSEKDIFDYIQWKYREPKDRSE
:::::::::::::::::::::::::::::::::::
CCDS61 LGVTGVAGEPLPVDSEKDIFDYIQWKYREPKDRSE
310 320 330
>>CCDS7513.1 POLL gene_id:27343|Hs108|chr10 (575 aa)
initn: 582 init1: 207 opt: 653 Z-score: 715.2 bits: 141.5 E(32554): 1.6e-33
Smith-Waterman score: 653; 34.2% identity (67.5% similar) in 345 aa overlap (2-333:245-573)
10 20 30
pF1KB6 MSKRKAPQETLNGGITDMLTELANFEKNVSQ
:..:: ...:. ::. : :: : :
CCDS75 ISGHYPTSLEGDCEPSPAPAVLDKWVCAQPSSQKATNHNLH--ITEKLEVLA---KAYSV
220 230 240 250 260
40 50 60 70 80
pF1KB6 AIHKYNA--YRKAASVIAKYPHKIKSGAEAKKLPGVGTKIAEKIDEFLATGKLRKLEKIR
:. : : :: ... .. . . : :: ..::.: ..:::: :.: .:.::::..:
CCDS75 QGDKWRALGYAKAINALKSFHKPVTSYQEACSIPGIGKRMAEKIIEILESGHLRKLDHI-
270 280 290 300 310 320
90 100 110 120 130 140
pF1KB6 QDDTSSSINFLTRVSGIGPSAARKFVDEGIKTLEDLRKNEDKLNHHQRIGLKYFGDFEKR
... ..... . : : ..:. . ..:...:::.: .. .:. .: ::::...:: .:
CCDS75 -SESVPVLELFSNIWGAGTKTAQMWYQQGFRSLEDIR-SQASLTTQQAIGLKHYSDFLER
330 340 350 360 370 380
150 160 170 180 190 200
pF1KB6 IPREEMLQMQDIVLNEVKKVDSEYIATVCGSFRRGAESSGDMDVLLTHPSFTSESTKQPK
.:::: .... : . .. .: . ..:::.::: . ::.:::.::: .. ..
CCDS75 MPREEATEIEQTVQKAAQAFNSGLLCVACGSYRRGKATCGDVDVLITHP----DGRSHRG
390 400 410 420 430 440
210 220 230 240 250 260
pF1KB6 LLHQVVEQLQKVHFITDTLSKGET-----KFMGVCQLPSKNDEKEYPHRRIDIRLIPKDQ
.. .....:.. :.:: : . : :..:::.::. . . :::.:: ..: ..
CCDS75 IFSRLLDSLRQEGFLTDDLVSQEENGQQQKYLGVCRLPGPGRR----HRRLDIIVVPYSE
450 460 470 480 490
270 280 290 300 310
pF1KB6 YYCGVLYFTGSDIFNKNMRAHALEKGFTINEYTIRPLGVTGV------AGEPLPVDSEKD
. :..:::::: ::..::: : ::....:... : .. :. ::. .:::
CCDS75 FACALLYFTGSAHFNRSMRALAKTKGMSLSEHALSTAVVRNTHGCKVGPGRVLPTPTEKD
500 510 520 530 540 550
320 330
pF1KB6 IFDYIQWKYREPKDRSE
.: . :::: .:
CCDS75 VFRLLGLPYREPAERDW
560 570
>>CCDS76332.1 POLL gene_id:27343|Hs108|chr10 (300 aa)
initn: 565 init1: 207 opt: 622 Z-score: 686.2 bits: 135.2 E(32554): 6.6e-32
Smith-Waterman score: 622; 35.4% identity (69.4% similar) in 291 aa overlap (54-333:19-298)
30 40 50 60 70 80
pF1KB6 NFEKNVSQAIHKYNAYRKAASVIAKYPHKIKSGAEAKKLPGVGTKIAEKIDEFLATGKLR
:. :: ..::.: ..:::: :.: .:.::
CCDS76 MLMHHQKYLQRFLGGKREKKQKEACSIPGIGKRMAEKIIEILESGHLR
10 20 30 40
90 100 110 120 130 140
pF1KB6 KLEKIRQDDTSSSINFLTRVSGIGPSAARKFVDEGIKTLEDLRKNEDKLNHHQRIGLKYF
::..: ... ..... . : : ..:. . ..:...:::.: .. .:. .: ::::..
CCDS76 KLDHI--SESVPVLELFSNIWGAGTKTAQMWYQQGFRSLEDIR-SQASLTTQQAIGLKHY
50 60 70 80 90 100
150 160 170 180 190 200
pF1KB6 GDFEKRIPREEMLQMQDIVLNEVKKVDSEYIATVCGSFRRGAESSGDMDVLLTHPSFTSE
.:: .:.:::: .... : . .. .: . ..:::.::: . ::.:::.:::. :.
CCDS76 SDFLERMPREEATEIEQTVQKAAQAFNSGLLCVACGSYRRGKATCGDVDVLITHPDGRSH
110 120 130 140 150 160
210 220 230 240 250
pF1KB6 STKQPKLLHQVVEQLQKVHFITDTLSKGET-----KFMGVCQLPSKNDEKEYPHRRIDIR
.. .....:.. :.:: : . : :..:::.::. . . :::.::
CCDS76 RG----IFSRLLDSLRQEGFLTDDLVSQEENGQQQKYLGVCRLPGPGRR----HRRLDII
170 180 190 200 210
260 270 280 290 300 310
pF1KB6 LIPKDQYYCGVLYFTGSDIFNKNMRAHALEKGFTINEYTIRPLGVTGV------AGEPLP
..: ... :..:::::: ::..::: : ::....:... : .. :. ::
CCDS76 VVPYSEFACALLYFTGSAHFNRSMRALAKTKGMSLSEHALSTAVVRNTHGCKVGPGRVLP
220 230 240 250 260 270
320 330
pF1KB6 VDSEKDIFDYIQWKYREPKDRSE
. .:::.: . :::: .:
CCDS76 TPTEKDVFRLLGLPYREPAERDW
280 290 300
>>CCDS34625.1 POLM gene_id:27434|Hs108|chr7 (494 aa)
initn: 365 init1: 324 opt: 346 Z-score: 382.2 bits: 79.6 E(32554): 5.8e-15
Smith-Waterman score: 398; 24.8% identity (60.2% similar) in 359 aa overlap (3-334:144-493)
10 20
pF1KB6 MSKRKAPQETLNGGITD---MLTELANFEKNV
.: .: : :... .:.: :.:: .
CCDS34 PVPVECRHRLEVAGPRKGPLSPAWMPAYACQRPTPLTHHNTGLSEALEILAEAAGFEGSE
120 130 140 150 160 170
30 40 50 60 70 80
pF1KB6 SQAIHKYNAYRKAASVIAKYPHKIKSGAEAKKLPGVGTKIAEKIDEFLATGKLRKLEKIR
.. . .. .::::. : . . .. . :: : . .. ..:.: : ...:..:
CCDS34 GRLL----TFCRAASVLKALPSPVTTLSQLQGLPHFGEHSSRVVQELLEHGVCEEVERVR
180 190 200 210 220
90 100 110 120 130 140
pF1KB6 QDDTSSSINFLTRVSGIGPSAARKFVDEGIKTLEDLRKNEDKLNHHQRIGLKYFGDFEKR
... ......:.. :.: ..: .. ::..::.:::.. .::...:. ::.. :.
CCDS34 RSERYQTMKLFTQIFGVGVKTADRWYREGLRTLDDLREQPQKLTQQQKAGLQHHQDLSTP
230 240 250 260 270 280
150 160 170 180 190 200
pF1KB6 IPREEMLQMQDIVLNEVKKVDSEYIATVCGSFRRGAESSGDMDVLLTHPSFTSESTKQPK
. : .. .:..: . : .. .:. :.:::: .. :.: :.:::. .:. :.
CCDS34 VLRSDVDALQQVVEEAVGQALPGATVTLTGGFRRGKLQGHDVDFLITHPKEGQEAGLLPR
290 300 310 320 330 340
210 220 230 240 250
pF1KB6 LLHQVVEQ-----LQKVHFITDTLSK-GETKFMGV-----C--QLPSK------NDEKEY
.. .. .: :. : .. .. .. . : . : .::. .. .
CCDS34 VMCRLQDQGLILYHQHQHSCCESPTRLAQQSHMDAFERSFCIFRLPQPPGAAVGGSTRPC
350 360 370 380 390 400
260 270 280 290 300
pF1KB6 PHR---RIDIRLIPKDQYYCGVLYFTGSDIFNKNMRAHAL-EKGFTINEYTI-RPLGVTG
: :.:. . : .:. ..: .::: .:....: . :::. .: . . : :
CCDS34 PSWKAVRVDLVVAPVSQFPFALLGWTGSKLFQRELRRFSRKEKGLWLNSHGLFDPEQKTF
410 420 430 440 450 460
310 320 330
pF1KB6 VAGEPLPVDSEKDIFDYIQWKYREPKDRSE
. . ::.::: .. .: :..:.
CCDS34 -----FQAASEEDIFRHLGLEYLPPEQRNA
470 480 490
>>CCDS44465.1 DNTT gene_id:1791|Hs108|chr10 (508 aa)
initn: 103 init1: 66 opt: 281 Z-score: 311.2 bits: 66.5 E(32554): 5.2e-11
Smith-Waterman score: 317; 24.1% identity (60.0% similar) in 345 aa overlap (17-334:173-507)
10 20 30 40
pF1KB6 MSKRKAPQETLNGGITDMLTELANFEKNVSQAIHKYNAYRKAASVI
:.:.: .:..: .. . .. .::::.
CCDS44 PPIAVQKISQYACQRRTTLNNCNQIFTDAFDILAENCEFRENEDSCV----TFMRAASVL
150 160 170 180 190
50 60 70 80 90 100
pF1KB6 AKYPHKIKSGAEAKKLPGVGTKIAEKIDEFLATGKLRKLEKIRQDDTSSSINFLTRVSGI
. : : : ... .: .:.:. :.:.. :. ... . .:. .:....: : :.
CCDS44 KSLPFTIISMKDTEGIPCLGSKVKGIIEEIIEDGESSEVKAVLNDERYQSFKLFTSVFGV
200 210 220 230 240 250
110 120 130 140 150 160
pF1KB6 GPSAARKFVDEGIKTLEDLRKNED-KLNHHQRIGLKYFGDFEKRIPREEMLQMQDIVLNE
: ....:. :..:: .:.... :... :. :. :. :. . . : : .. .: .
CCDS44 GLKTSEKWFRMGFRTLSKVRSDKSLKFTRMQKAGFLYYEDLVSCVTRAEAEAVSVLVKEA
260 270 280 290 300 310
170 180 190 200 210
pF1KB6 VKKVDSEYIATVCGSFRRGAESSGDMDVLLTHPSFTSESTK---------QPK---LLHQ
: . ..:. :.:::: . . :.: :.: :. : . . . : : ..
CCDS44 VWAFLPDAFVTMTGGFRRGKKMGHDVDFLITSPGSTEDEEQLLQKVMNLWEKKGLLLYYD
320 330 340 350 360 370
220 230 240 250 260
pF1KB6 VVEQ-LQKVHFIT---DTLSKGETKFMGVCQLPSK---NDE------KEYPHRRIDIRLI
.::. ..:... . :.:.. . :. . .:: . .:. : . :.:. :
CCDS44 LVESTFEKLRLPSRKVDALDHFQKCFL-IFKLPRQRVDSDQSSWQEGKTWKAIRVDLVLC
380 390 400 410 420 430
270 280 290 300 310
pF1KB6 PKDQYYCGVLYFTGSDIFNKNMRAHAL-EKGFTINEYTIRPLGVTGVAGEPLPVDSEKDI
: .. ..: .::: :....: .: :. . ...... . : ..::..:
CCDS44 PYERRAFALLGWTGSR-FERDLRRYATHERKMILDNHALYD----KTKRIFLKAESEEEI
440 450 460 470 480 490
320 330
pF1KB6 FDYIQWKYREPKDRSE
: .. : :: .:.
CCDS44 FAHLGLDYIEPWERNA
500
>>CCDS7447.1 DNTT gene_id:1791|Hs108|chr10 (509 aa)
initn: 103 init1: 66 opt: 281 Z-score: 311.2 bits: 66.5 E(32554): 5.2e-11
Smith-Waterman score: 326; 24.1% identity (60.0% similar) in 345 aa overlap (17-334:173-508)
10 20 30 40
pF1KB6 MSKRKAPQETLNGGITDMLTELANFEKNVSQAIHKYNAYRKAASVI
:.:.: .:..: .. . .. .::::.
CCDS74 PPIAVQKISQYACQRRTTLNNCNQIFTDAFDILAENCEFRENEDSCV----TFMRAASVL
150 160 170 180 190
50 60 70 80 90 100
pF1KB6 AKYPHKIKSGAEAKKLPGVGTKIAEKIDEFLATGKLRKLEKIRQDDTSSSINFLTRVSGI
. : : : ... .: .:.:. :.:.. :. ... . .:. .:....: : :.
CCDS74 KSLPFTIISMKDTEGIPCLGSKVKGIIEEIIEDGESSEVKAVLNDERYQSFKLFTSVFGV
200 210 220 230 240 250
110 120 130 140 150 160
pF1KB6 GPSAARKFVDEGIKTLEDLRKNED-KLNHHQRIGLKYFGDFEKRIPREEMLQMQDIVLNE
: ....:. :..:: .:.... :... :. :. :. :. . . : : .. .: .
CCDS74 GLKTSEKWFRMGFRTLSKVRSDKSLKFTRMQKAGFLYYEDLVSCVTRAEAEAVSVLVKEA
260 270 280 290 300 310
170 180 190 200 210
pF1KB6 VKKVDSEYIATVCGSFRRGAESSGDMDVLLTHPSFTSESTK---------QPK---LLHQ
: . ..:. :.:::: . . :.: :.: :. : . . . : : ..
CCDS74 VWAFLPDAFVTMTGGFRRGKKMGHDVDFLITSPGSTEDEEQLLQKVMNLWEKKGLLLYYD
320 330 340 350 360 370
220 230 240 250 260
pF1KB6 VVEQ-LQKVHFIT---DTLSKGETKFMGVCQLPSK---NDE------KEYPHRRIDIRLI
.::. ..:... . :.:.. . :. . .:: . .:. : . :.:. :
CCDS74 LVESTFEKLRLPSRKVDALDHFQKCFL-IFKLPRQRVDSDQSSWQEGKTWKAIRVDLVLC
380 390 400 410 420 430
270 280 290 300 310
pF1KB6 PKDQYYCGVLYFTGSDIFNKNMRAHAL-EKGFTINEYTIRPLGVTGVAGEPLPVDSEKDI
: .. ..: .::: :....: .: :. . ...... . : ..::..:
CCDS74 PYERRAFALLGWTGSRQFERDLRRYATHERKMILDNHALYD----KTKRIFLKAESEEEI
440 450 460 470 480 490
320 330
pF1KB6 FDYIQWKYREPKDRSE
: .. : :: .:.
CCDS74 FAHLGLDYIEPWERNA
500
335 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Fri Nov 4 20:50:29 2016 done: Fri Nov 4 20:50:30 2016
Total Scan time: 2.540 Total Display time: 0.020
Function used was FASTA [36.3.4 Apr, 2011]