FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KSDA1470, 522 aa
1>>>pF1KSDA1470 522 - 522 aa - 522 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.8937+/-0.000915; mu= 11.8882+/- 0.055
mean_var=124.2099+/-25.115, 0's: 0 Z-trim(109.9): 36 B-trim: 0 in 0/50
Lambda= 0.115079
statistics sampled from 11196 (11230) to 11196 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.695), E-opt: 0.2 (0.345), width: 16
Scan time: 3.040
The best scores are: opt bits E(32554)
CCDS181.1 RCC2 gene_id:55920|Hs108|chr1 ( 522) 3555 601.5 7.5e-172
CCDS323.1 RCC1 gene_id:1104|Hs108|chr1 ( 421) 394 76.6 6.1e-14
CCDS41295.1 RCC1 gene_id:1104|Hs108|chr1 ( 452) 394 76.7 6.4e-14
CCDS45277.1 HERC1 gene_id:8925|Hs108|chr15 (4861) 365 72.6 1.2e-11
CCDS82939.1 HERC3 gene_id:8916|Hs108|chr4 ( 368) 346 68.6 1.4e-11
CCDS34028.1 HERC3 gene_id:8916|Hs108|chr4 (1050) 346 68.9 3.1e-11
>>CCDS181.1 RCC2 gene_id:55920|Hs108|chr1 (522 aa)
initn: 3555 init1: 3555 opt: 3555 Z-score: 3198.7 bits: 601.5 E(32554): 7.5e-172
Smith-Waterman score: 3555; 100.0% identity (100.0% similar) in 522 aa overlap (1-522:1-522)
10 20 30 40 50 60
pF1KSD MPRKKAAAAAWEEPSSGNGTARAGPRKRGGPAGRKRERPERCSSSSGGGSSGDEDGLELD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 MPRKKAAAAAWEEPSSGNGTARAGPRKRGGPAGRKRERPERCSSSSGGGSSGDEDGLELD
10 20 30 40 50 60
70 80 90 100 110 120
pF1KSD GAPGGGKRAARPATAGKAGGAAVVITEPEHTKERVKLEGSKCKGQLLIFGATNWDLIGRK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 GAPGGGKRAARPATAGKAGGAAVVITEPEHTKERVKLEGSKCKGQLLIFGATNWDLIGRK
70 80 90 100 110 120
130 140 150 160 170 180
pF1KSD EVPKQQAAYRNLGQNLWGPHRYGCLAGVRVRTVVSGSCAAHSLLITTEGKLWSWGRNEKG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 EVPKQQAAYRNLGQNLWGPHRYGCLAGVRVRTVVSGSCAAHSLLITTEGKLWSWGRNEKG
130 140 150 160 170 180
190 200 210 220 230 240
pF1KSD QLGHGDTKRVEAPRLIEGLSHEVIVSAACGRNHTLALTETGSVFAFGENKMGQLGLGNQT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 QLGHGDTKRVEAPRLIEGLSHEVIVSAACGRNHTLALTETGSVFAFGENKMGQLGLGNQT
190 200 210 220 230 240
250 260 270 280 290 300
pF1KSD DAVPSPAQIMYNGQPITKMACGAEFSMIMDCKGNLYSFGCPEYGQLGHNSDGKFIARAQR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 DAVPSPAQIMYNGQPITKMACGAEFSMIMDCKGNLYSFGCPEYGQLGHNSDGKFIARAQR
250 260 270 280 290 300
310 320 330 340 350 360
pF1KSD IEYDCELVPRRVAIFIEKTKDGQILPVPNVVVRDVACGANHTLVLDSQKRVFSWGFGGYG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 IEYDCELVPRRVAIFIEKTKDGQILPVPNVVVRDVACGANHTLVLDSQKRVFSWGFGGYG
310 320 330 340 350 360
370 380 390 400 410 420
pF1KSD RLGHAEQKDEMVPRLVKLFDFPGRGASQIYAGYTCSFAVSEVGGLFFWGATNTSRESTMY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 RLGHAEQKDEMVPRLVKLFDFPGRGASQIYAGYTCSFAVSEVGGLFFWGATNTSRESTMY
370 380 390 400 410 420
430 440 450 460 470 480
pF1KSD PKAVQDLCGWRIRSLACGKSSIIVAADESTISWGPSPTFGELGYGDHKPKSSTAAQEVKT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS18 PKAVQDLCGWRIRSLACGKSSIIVAADESTISWGPSPTFGELGYGDHKPKSSTAAQEVKT
430 440 450 460 470 480
490 500 510 520
pF1KSD LDGIFSEQVAMGYSHSLVIARDESETEKEKIKKLPEYNPRTL
::::::::::::::::::::::::::::::::::::::::::
CCDS18 LDGIFSEQVAMGYSHSLVIARDESETEKEKIKKLPEYNPRTL
490 500 510 520
>>CCDS323.1 RCC1 gene_id:1104|Hs108|chr1 (421 aa)
initn: 347 init1: 111 opt: 394 Z-score: 363.8 bits: 76.6 E(32554): 6.1e-14
Smith-Waterman score: 394; 24.8% identity (58.1% similar) in 387 aa overlap (132-506:50-421)
110 120 130 140 150 160
pF1KSD CKGQLLIFGATNWDLIGRKEVPKQQAAYRNLGQNLWGPHRYGCLAGVRVRTVVSGSCAAH
::.:. .. :... .: . . . :
CCDS32 SKKVKVSHRSHSTEPGLVLTLGQGDVGQLGLGENVM-ERKKPALVSIPEDVVQAEAGGMH
20 30 40 50 60 70
170 180 190 200 210
pF1KSD SLLITTEGKLWSWGRNEKGQLGHGDTKRVEAPRLIEGLS--HEVIVSAACGRNHTLALTE
.. .. :...:.: :..: ::. ::. ::. ... : .: .:... : .:: :::.
CCDS32 TVCLSKSGQVYSFGCNDEGALGR-DTS-VEGSEMVPGKVELQEKVVQVSAGDSHTAALTD
80 90 100 110 120 130
220 230 240 250 260 270
pF1KSD TGSVFAFG--ENKMGQLGLGNQTDAVPSPAQIMYNGQPITKMACGAEFSMIMDCKGNLYS
: :: .: ... : .:: . :.:.. . :..:.: : . ... :.::.
CCDS32 DGRVFLWGSFRDNNGVIGLLEPMKKSMVPVQVQLD-VPVVKVASGNDHLVMLTADGDLYT
140 150 160 170 180 190
280 290 300 310 320 330
pF1KSD FGCPEYGQLGHNSDGKFIARAQRIEYDCELVPRRVAIFIEKTKDGQILPVPNVVVRDVAC
.:: : ::::. . : :. : . :::. : . :.. .. .: .:. :
CCDS32 LGCGEQGQLGRVPE-LFANRGGRQGLERLLVPKCVML---KSRGSR----GHVRFQDAFC
200 210 220 230 240
340 350 360 370 380 390
pF1KSD GANHTLVLDSQKRVFSWGFGGYGRLGHAEQKDEMVPRLVKLFDFPGRGASQIYAGYTCSF
:: :.... . .:...:...: .:: .. ..:. . : .. . .: .
CCDS32 GAYFTFAISHEGHVYGFGLSNYHQLGTPGTESCFIPQNLTSFKNSTKSWVGFSGGQHHTV
250 260 270 280 290 300
400 410 420 430 440
pF1KSD AVSEVGGLFFWGATNTSR-------ESTMYPKAVQDLCGWRIRSLACGKS-SIIVAADES
.. : . : .. .: : : .. : . . :.::: : . :. :
CCDS32 CMDSEGKAYSLGRAEYGRLGLGEGAEEKSIPTLISRLPA--VSSVACGASVGYAVTKDGR
310 320 330 340 350 360
450 460 470 480 490 500
pF1KSD TISWGPSPTFGELGYGDHKPKSSTAAQEVKTLDGIFSEQVAMGYSHSLVIARDESETEKE
...:: . .. .:: :. . : . . : :.. .:. : .:......:. ..
CCDS32 VFAWGMGTNY-QLGTGQDEDAWSPVEMMGKQLENRVVLSVSSGGQHTVLLVKDKEQS
370 380 390 400 410 420
510 520
pF1KSD KIKKLPEYNPRTL
>>CCDS41295.1 RCC1 gene_id:1104|Hs108|chr1 (452 aa)
initn: 347 init1: 111 opt: 394 Z-score: 363.3 bits: 76.7 E(32554): 6.4e-14
Smith-Waterman score: 394; 24.8% identity (58.1% similar) in 387 aa overlap (132-506:81-452)
110 120 130 140 150 160
pF1KSD CKGQLLIFGATNWDLIGRKEVPKQQAAYRNLGQNLWGPHRYGCLAGVRVRTVVSGSCAAH
::.:. .. :... .: . . . :
CCDS41 QKTRPVSHRSHSTEPGLVLTLGQGDVGQLGLGENVM-ERKKPALVSIPEDVVQAEAGGMH
60 70 80 90 100
170 180 190 200 210
pF1KSD SLLITTEGKLWSWGRNEKGQLGHGDTKRVEAPRLIEGLS--HEVIVSAACGRNHTLALTE
.. .. :...:.: :..: ::. ::. ::. ... : .: .:... : .:: :::.
CCDS41 TVCLSKSGQVYSFGCNDEGALGR-DTS-VEGSEMVPGKVELQEKVVQVSAGDSHTAALTD
110 120 130 140 150 160
220 230 240 250 260 270
pF1KSD TGSVFAFG--ENKMGQLGLGNQTDAVPSPAQIMYNGQPITKMACGAEFSMIMDCKGNLYS
: :: .: ... : .:: . :.:.. . :..:.: : . ... :.::.
CCDS41 DGRVFLWGSFRDNNGVIGLLEPMKKSMVPVQVQLD-VPVVKVASGNDHLVMLTADGDLYT
170 180 190 200 210 220
280 290 300 310 320 330
pF1KSD FGCPEYGQLGHNSDGKFIARAQRIEYDCELVPRRVAIFIEKTKDGQILPVPNVVVRDVAC
.:: : ::::. . : :. : . :::. : . :.. .. .: .:. :
CCDS41 LGCGEQGQLGRVPE-LFANRGGRQGLERLLVPKCVML---KSRGSR----GHVRFQDAFC
230 240 250 260 270
340 350 360 370 380 390
pF1KSD GANHTLVLDSQKRVFSWGFGGYGRLGHAEQKDEMVPRLVKLFDFPGRGASQIYAGYTCSF
:: :.... . .:...:...: .:: .. ..:. . : .. . .: .
CCDS41 GAYFTFAISHEGHVYGFGLSNYHQLGTPGTESCFIPQNLTSFKNSTKSWVGFSGGQHHTV
280 290 300 310 320 330
400 410 420 430 440
pF1KSD AVSEVGGLFFWGATNTSR-------ESTMYPKAVQDLCGWRIRSLACGKS-SIIVAADES
.. : . : .. .: : : .. : . . :.::: : . :. :
CCDS41 CMDSEGKAYSLGRAEYGRLGLGEGAEEKSIPTLISRLPA--VSSVACGASVGYAVTKDGR
340 350 360 370 380 390
450 460 470 480 490 500
pF1KSD TISWGPSPTFGELGYGDHKPKSSTAAQEVKTLDGIFSEQVAMGYSHSLVIARDESETEKE
...:: . .. .:: :. . : . . : :.. .:. : .:......:. ..
CCDS41 VFAWGMGTNY-QLGTGQDEDAWSPVEMMGKQLENRVVLSVSSGGQHTVLLVKDKEQS
400 410 420 430 440 450
510 520
pF1KSD KIKKLPEYNPRTL
>>CCDS45277.1 HERC1 gene_id:8925|Hs108|chr15 (4861 aa)
initn: 431 init1: 286 opt: 365 Z-score: 322.6 bits: 72.6 E(32554): 1.2e-11
Smith-Waterman score: 456; 33.0% identity (60.8% similar) in 288 aa overlap (145-398:4076-4357)
120 130 140 150 160 170
pF1KSD DLIGRKEVPKQQAAYRNLGQNLWGPHRYGCLAGVRVRTVVSGSCAA--HSLLITTEGKLW
: : : .:. ::.. ::. .: :...
CCDS45 GTVLACGEGSYGRLGQGNSDDLHVLTVISALQGFVVTQLVT-SCGSDGHSMALTESGEVF
4050 4060 4070 4080 4090 4100
180 190 200 210 220 230
pF1KSD SWGRNEKGQLGHGDTKRVEAPRLIEGLSHEVIVSAACGRNHTLALTETGSVFAFGENKMG
::: .. :.::::.. : . :: ::.:. : .:. .:: .:. ..: :..:.::.. .:
CCDS45 SWGDGDYGKLGHGNSDRQRRPRQIEALQGEEVVQMSCGFKHSAVVTSDGKLFTFGNGDYG
4110 4120 4130 4140 4150 4160
240 250 260 270 280
pF1KSD QLGLGNQTDAVPSPAQIM-YNGQPITKMACGAEFSMIMDCKGNL-YSFGCPEYGQLG-HN
.::::: .. : .. .: : ..::: . .. .. :.. ..:: .::.:: :
CCDS45 RLGLGNTSNK-KLPERVTALEGYQIGQVACGLNHTLAVSADGSMVWAFGDGDYGKLGLGN
4170 4180 4190 4200 4210 4220
290 300 310 320
pF1KSD SDGKFIARAQRIEYDCELVPRRVA----IFIEKTKDGQI----------LP---------
: .: . :.:. : . ..:: . . ::::.. ::
CCDS45 STAK--SSPQKIDVLCGIGIKKVACGTQFSVALTKDGHVYTFGQDRLIGLPEGRARNHNR
4230 4240 4250 4260 4270 4280
330 340 350 360 370 380
pF1KSD ---VP---NVVVRDVACGANHTLVLDSQKRVFSWGFGGYGRLGHAEQKDEMVPRLVKLFD
.: .:...::: ::.:::.: :. :..:: .. :.:: .. . : ::
CCDS45 PQQIPVLAGVIIEDVAVGAEHTLALASNGDVYAWGSNSEGQLGLGHTNHVREPTLVT--G
4290 4300 4310 4320 4330
390 400 410 420 430 440
pF1KSD FPGRGASQIYAGYTCSFAVSEVGGLFFWGATNTSRESTMYPKAVQDLCGWRIRSLACGKS
. :... :: :: : :
CCDS45 LQGKNVRQISAGRCHSAAWTAPPVPPRAPGVSVPLQLGLPDTVPPQYGALREVSIHTVRA
4340 4350 4360 4370 4380 4390
>>CCDS82939.1 HERC3 gene_id:8916|Hs108|chr4 (368 aa)
initn: 446 init1: 263 opt: 346 Z-score: 321.5 bits: 68.6 E(32554): 1.4e-11
Smith-Waterman score: 447; 28.6% identity (58.7% similar) in 346 aa overlap (132-465:14-330)
110 120 130 140 150
pF1KSD CKGQLLIFGATNWDLIGRKEVPKQQAAYRNLGQNLWG----PHRYGCLAGVRVRTVVSGS
.. :: : :. : .. :. :. :
CCDS82 MLCWGYWSLGQPGISTNLQGIVAEPQVCGFISDRSVKEVACG-
10 20 30 40
160 170 180 190 200 210
pF1KSD CAAHSLLITTEGKLWSWGRNEKGQLGHGDTKRVEAPRLIEGLSHEVIVSAACGRNHTLAL
. ::... .:.... : : :::::: .. . :. : .:. . :. .:::..:.:::
CCDS82 -GNHSVFLLEDGEVYTCGLNTKGQLGH--EREGNKPEQIGALADQHIIHVACGESHSLAL
50 60 70 80 90
220 230 240 250 260 270
pF1KSD TETGSVFAFGENKMGQLGLGNQTDAVPSPAQIM-YNGQPITKMACGAEFSMIMDCKGNLY
.. :..:..: .. ::::: . :.: : :. : : : ...:: . . :...
CCDS82 SDRGQLFSWGAGSDGQLGLMTTEDSVAVPRLIQKLNQQTILQVSCGNWHCLALAADGQFF
100 110 120 130 140 150
280 290 300 310 320 330
pF1KSD SFGCPEYGQLGHNSDGKFIARAQRIEYDCELVPRRVAIFIEKTKDGQILPVPNVVVRDVA
..: .:::: :: :. . :.:: .. .: .: . .::
CCDS82 TWGKNSHGQLGL---GK--------EFPSQASPQRV-----RSLEG----IP---LAQVA
160 170 180 190
340 350 360 370 380 390
pF1KSD CGANHTLVLDSQKRVFSWGFGGYGRLGHAEQKDEMVPRLVKLFDFPGRGASQIYAGYTCS
:. :...:. . ::.::... :.:: ...::. : :::. . . : : .
CCDS82 AGGAHSFALSLSGAVFGWGMNNAGQLGLSDEKDRESPCHVKLLR--TQKVVYISCGEEHT
200 210 220 230 240 250
400 410 420 430 440 450
pF1KSD FAVSEVGGLFFWGATNT------SRESTMYPKAVQDLCGWRIRSLACGKSSIIVAADEST
.... ::.: .:: . : .. . :. : .: : .. ..:::.. .. . :
CCDS82 AVLTKSGGVFTFGAGSCGQLGHDSMNDEVNPRRVLELMGSEVTQIACGRQHTLAFVPSSG
260 270 280 290 300 310
460 470 480 490 500
pF1KSD ISWG-PSPTFGELGYGDHKPKSSTAAQEVKTLDGIFSEQVAMGYSHSLVIARDESETEKE
. .. . :.:: :
CCDS82 LIYAFGCGARGQLGTGHTCNVKCPSPVKGYWAAHSGQLSARAGKNDCLWNLKVF
320 330 340 350 360
>>CCDS34028.1 HERC3 gene_id:8916|Hs108|chr4 (1050 aa)
initn: 320 init1: 263 opt: 346 Z-score: 315.1 bits: 68.9 E(32554): 3.1e-11
Smith-Waterman score: 447; 28.6% identity (58.7% similar) in 346 aa overlap (132-465:14-330)
110 120 130 140 150
pF1KSD CKGQLLIFGATNWDLIGRKEVPKQQAAYRNLGQNLWG----PHRYGCLAGVRVRTVVSGS
.. :: : :. : .. :. :. :
CCDS34 MLCWGYWSLGQPGISTNLQGIVAEPQVCGFISDRSVKEVACG-
10 20 30 40
160 170 180 190 200 210
pF1KSD CAAHSLLITTEGKLWSWGRNEKGQLGHGDTKRVEAPRLIEGLSHEVIVSAACGRNHTLAL
. ::... .:.... : : :::::: .. . :. : .:. . :. .:::..:.:::
CCDS34 -GNHSVFLLEDGEVYTCGLNTKGQLGH--EREGNKPEQIGALADQHIIHVACGESHSLAL
50 60 70 80 90
220 230 240 250 260 270
pF1KSD TETGSVFAFGENKMGQLGLGNQTDAVPSPAQIM-YNGQPITKMACGAEFSMIMDCKGNLY
.. :..:..: .. ::::: . :.: : :. : : : ...:: . . :...
CCDS34 SDRGQLFSWGAGSDGQLGLMTTEDSVAVPRLIQKLNQQTILQVSCGNWHCLALAADGQFF
100 110 120 130 140 150
280 290 300 310 320 330
pF1KSD SFGCPEYGQLGHNSDGKFIARAQRIEYDCELVPRRVAIFIEKTKDGQILPVPNVVVRDVA
..: .:::: :: :. . :.:: .. .: .: . .::
CCDS34 TWGKNSHGQLGL---GK--------EFPSQASPQRV-----RSLEG----IP---LAQVA
160 170 180 190
340 350 360 370 380 390
pF1KSD CGANHTLVLDSQKRVFSWGFGGYGRLGHAEQKDEMVPRLVKLFDFPGRGASQIYAGYTCS
:. :...:. . ::.::... :.:: ...::. : :::. . . : : .
CCDS34 AGGAHSFALSLSGAVFGWGMNNAGQLGLSDEKDRESPCHVKLLR--TQKVVYISCGEEHT
200 210 220 230 240 250
400 410 420 430 440 450
pF1KSD FAVSEVGGLFFWGATNT------SRESTMYPKAVQDLCGWRIRSLACGKSSIIVAADEST
.... ::.: .:: . : .. . :. : .: : .. ..:::.. .. . :
CCDS34 AVLTKSGGVFTFGAGSCGQLGHDSMNDEVNPRRVLELMGSEVTQIACGRQHTLAFVPSSG
260 270 280 290 300 310
460 470 480 490 500
pF1KSD ISWG-PSPTFGELGYGDHKPKSSTAAQEVKTLDGIFSEQVAMGYSHSLVIARDESETEKE
. .. . :.:: :
CCDS34 LIYAFGCGARGQLGTGHTCNVKCPSPVKGYWAAHSGQLSARADRFKYHIVKQIFSGGDQT
320 330 340 350 360 370
522 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 06:24:31 2016 done: Thu Nov 3 06:24:31 2016
Total Scan time: 3.040 Total Display time: 0.030
Function used was FASTA [36.3.4 Apr, 2011]