FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE2519, 555 aa
1>>>pF1KE2519 555 - 555 aa - 555 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 6.3774+/-0.000823; mu= 14.8859+/- 0.050
mean_var=101.4837+/-20.477, 0's: 0 Z-trim(110.1): 18 B-trim: 69 in 1/50
Lambda= 0.127314
statistics sampled from 11359 (11372) to 11359 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.711), E-opt: 0.2 (0.349), width: 16
Scan time: 2.860
The best scores are: opt bits E(32554)
CCDS53284.1 GRHL3 gene_id:57822|Hs108|chr1 ( 556) 3749 699.0 3.7e-201
CCDS44088.1 GRHL3 gene_id:57822|Hs108|chr1 ( 602) 3749 699.1 3.9e-201
CCDS251.1 GRHL3 gene_id:57822|Hs108|chr1 ( 607) 3749 699.1 4e-201
CCDS252.2 GRHL3 gene_id:57822|Hs108|chr1 ( 626) 3513 655.7 4.6e-188
CCDS33144.2 GRHL1 gene_id:29841|Hs108|chr2 ( 618) 1386 265.0 1.8e-70
CCDS83312.1 GRHL2 gene_id:79977|Hs108|chr8 ( 609) 1369 261.9 1.6e-69
CCDS34931.1 GRHL2 gene_id:79977|Hs108|chr8 ( 625) 1369 261.9 1.6e-69
CCDS2134.1 TFCP2L1 gene_id:29842|Hs108|chr2 ( 479) 352 75.1 2.2e-13
CCDS46788.1 UBP1 gene_id:7342|Hs108|chr3 ( 504) 351 74.9 2.6e-13
CCDS2659.1 UBP1 gene_id:7342|Hs108|chr3 ( 540) 347 74.2 4.6e-13
CCDS8808.1 TFCP2 gene_id:7024|Hs108|chr12 ( 502) 339 72.7 1.2e-12
>>CCDS53284.1 GRHL3 gene_id:57822|Hs108|chr1 (556 aa)
initn: 3749 init1: 3749 opt: 3749 Z-score: 3724.9 bits: 699.0 E(32554): 3.7e-201
Smith-Waterman score: 3749; 100.0% identity (100.0% similar) in 555 aa overlap (1-555:2-556)
10 20 30 40 50
pF1KE2 MRVNGDDDSVAALSFLYDYYMGPKEKRILSSSTGGRNDQGKRYYHGMEYETDLTPLESP
:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 MMRVNGDDDSVAALSFLYDYYMGPKEKRILSSSTGGRNDQGKRYYHGMEYETDLTPLESP
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE2 THLMKFLTENVSGTPEYPDLLKKNNLMSLEGALPTPGKAAPLPAGPSKLEAGSVDSYLLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 THLMKFLTENVSGTPEYPDLLKKNNLMSLEGALPTPGKAAPLPAGPSKLEAGSVDSYLLP
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE2 TTDMYDNGSLNSLFESIHGVPPTQRWQPDSTFKDDPQESMLFPDILKTSPEPPCPEDYPS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 TTDMYDNGSLNSLFESIHGVPPTQRWQPDSTFKDDPQESMLFPDILKTSPEPPCPEDYPS
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE2 LKSDFEYTLGSPKAIHIKSGESPMAYLNKGQFYPVTLRTPAGGKGLALSSNKVKSVVMVV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 LKSDFEYTLGSPKAIHIKSGESPMAYLNKGQFYPVTLRTPAGGKGLALSSNKVKSVVMVV
190 200 210 220 230 240
240 250 260 270 280 290
pF1KE2 FDNEKVPVEQLRFWKHWHSRQPTAKQRVIDVADCKENFNTVEHIEEVAYNALSFVWNVNE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 FDNEKVPVEQLRFWKHWHSRQPTAKQRVIDVADCKENFNTVEHIEEVAYNALSFVWNVNE
250 260 270 280 290 300
300 310 320 330 340 350
pF1KE2 EAKVFIGVNCLSTDFSSQKGVKGVPLNLQIDTYDCGLGTERLVHRAVCQIKIFCDKGAER
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 EAKVFIGVNCLSTDFSSQKGVKGVPLNLQIDTYDCGLGTERLVHRAVCQIKIFCDKGAER
310 320 330 340 350 360
360 370 380 390 400 410
pF1KE2 KMRDDERKQFRRKVKCPDSSNSGVKGCLLSGFRGNETTYLRPETDLETPPVLFIPNVHFS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 KMRDDERKQFRRKVKCPDSSNSGVKGCLLSGFRGNETTYLRPETDLETPPVLFIPNVHFS
370 380 390 400 410 420
420 430 440 450 460 470
pF1KE2 SLQRSGGAAPSAGPSSSNRLPLKRTCSPFTEEFEPLPSKQAKEGDLQRVLLYVRRETEEV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 SLQRSGGAAPSAGPSSSNRLPLKRTCSPFTEEFEPLPSKQAKEGDLQRVLLYVRRETEEV
430 440 450 460 470 480
480 490 500 510 520 530
pF1KE2 FDALMLKTPDLKGLRNAISEKYGFPEENIYKVYKKCKRGILVNMDNNIIQHYSNHVAFLL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS53 FDALMLKTPDLKGLRNAISEKYGFPEENIYKVYKKCKRGILVNMDNNIIQHYSNHVAFLL
490 500 510 520 530 540
540 550
pF1KE2 DMGELDGKIQIILKEL
::::::::::::::::
CCDS53 DMGELDGKIQIILKEL
550
>>CCDS44088.1 GRHL3 gene_id:57822|Hs108|chr1 (602 aa)
initn: 3749 init1: 3749 opt: 3749 Z-score: 3724.4 bits: 699.1 E(32554): 3.9e-201
Smith-Waterman score: 3749; 100.0% identity (100.0% similar) in 555 aa overlap (1-555:48-602)
10 20 30
pF1KE2 MRVNGDDDSVAALSFLYDYYMGPKEKRILS
::::::::::::::::::::::::::::::
CCDS44 VNLQKFSYTSEDEAWKTYLENPLTAATKAMMRVNGDDDSVAALSFLYDYYMGPKEKRILS
20 30 40 50 60 70
40 50 60 70 80 90
pF1KE2 SSTGGRNDQGKRYYHGMEYETDLTPLESPTHLMKFLTENVSGTPEYPDLLKKNNLMSLEG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 SSTGGRNDQGKRYYHGMEYETDLTPLESPTHLMKFLTENVSGTPEYPDLLKKNNLMSLEG
80 90 100 110 120 130
100 110 120 130 140 150
pF1KE2 ALPTPGKAAPLPAGPSKLEAGSVDSYLLPTTDMYDNGSLNSLFESIHGVPPTQRWQPDST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 ALPTPGKAAPLPAGPSKLEAGSVDSYLLPTTDMYDNGSLNSLFESIHGVPPTQRWQPDST
140 150 160 170 180 190
160 170 180 190 200 210
pF1KE2 FKDDPQESMLFPDILKTSPEPPCPEDYPSLKSDFEYTLGSPKAIHIKSGESPMAYLNKGQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 FKDDPQESMLFPDILKTSPEPPCPEDYPSLKSDFEYTLGSPKAIHIKSGESPMAYLNKGQ
200 210 220 230 240 250
220 230 240 250 260 270
pF1KE2 FYPVTLRTPAGGKGLALSSNKVKSVVMVVFDNEKVPVEQLRFWKHWHSRQPTAKQRVIDV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 FYPVTLRTPAGGKGLALSSNKVKSVVMVVFDNEKVPVEQLRFWKHWHSRQPTAKQRVIDV
260 270 280 290 300 310
280 290 300 310 320 330
pF1KE2 ADCKENFNTVEHIEEVAYNALSFVWNVNEEAKVFIGVNCLSTDFSSQKGVKGVPLNLQID
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 ADCKENFNTVEHIEEVAYNALSFVWNVNEEAKVFIGVNCLSTDFSSQKGVKGVPLNLQID
320 330 340 350 360 370
340 350 360 370 380 390
pF1KE2 TYDCGLGTERLVHRAVCQIKIFCDKGAERKMRDDERKQFRRKVKCPDSSNSGVKGCLLSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 TYDCGLGTERLVHRAVCQIKIFCDKGAERKMRDDERKQFRRKVKCPDSSNSGVKGCLLSG
380 390 400 410 420 430
400 410 420 430 440 450
pF1KE2 FRGNETTYLRPETDLETPPVLFIPNVHFSSLQRSGGAAPSAGPSSSNRLPLKRTCSPFTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 FRGNETTYLRPETDLETPPVLFIPNVHFSSLQRSGGAAPSAGPSSSNRLPLKRTCSPFTE
440 450 460 470 480 490
460 470 480 490 500 510
pF1KE2 EFEPLPSKQAKEGDLQRVLLYVRRETEEVFDALMLKTPDLKGLRNAISEKYGFPEENIYK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS44 EFEPLPSKQAKEGDLQRVLLYVRRETEEVFDALMLKTPDLKGLRNAISEKYGFPEENIYK
500 510 520 530 540 550
520 530 540 550
pF1KE2 VYKKCKRGILVNMDNNIIQHYSNHVAFLLDMGELDGKIQIILKEL
:::::::::::::::::::::::::::::::::::::::::::::
CCDS44 VYKKCKRGILVNMDNNIIQHYSNHVAFLLDMGELDGKIQIILKEL
560 570 580 590 600
>>CCDS251.1 GRHL3 gene_id:57822|Hs108|chr1 (607 aa)
initn: 3749 init1: 3749 opt: 3749 Z-score: 3724.3 bits: 699.1 E(32554): 4e-201
Smith-Waterman score: 3749; 100.0% identity (100.0% similar) in 555 aa overlap (1-555:53-607)
10 20 30
pF1KE2 MRVNGDDDSVAALSFLYDYYMGPKEKRILS
::::::::::::::::::::::::::::::
CCDS25 VNLQKFSYTSEDEAWKTYLENPLTAATKAMMRVNGDDDSVAALSFLYDYYMGPKEKRILS
30 40 50 60 70 80
40 50 60 70 80 90
pF1KE2 SSTGGRNDQGKRYYHGMEYETDLTPLESPTHLMKFLTENVSGTPEYPDLLKKNNLMSLEG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS25 SSTGGRNDQGKRYYHGMEYETDLTPLESPTHLMKFLTENVSGTPEYPDLLKKNNLMSLEG
90 100 110 120 130 140
100 110 120 130 140 150
pF1KE2 ALPTPGKAAPLPAGPSKLEAGSVDSYLLPTTDMYDNGSLNSLFESIHGVPPTQRWQPDST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS25 ALPTPGKAAPLPAGPSKLEAGSVDSYLLPTTDMYDNGSLNSLFESIHGVPPTQRWQPDST
150 160 170 180 190 200
160 170 180 190 200 210
pF1KE2 FKDDPQESMLFPDILKTSPEPPCPEDYPSLKSDFEYTLGSPKAIHIKSGESPMAYLNKGQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS25 FKDDPQESMLFPDILKTSPEPPCPEDYPSLKSDFEYTLGSPKAIHIKSGESPMAYLNKGQ
210 220 230 240 250 260
220 230 240 250 260 270
pF1KE2 FYPVTLRTPAGGKGLALSSNKVKSVVMVVFDNEKVPVEQLRFWKHWHSRQPTAKQRVIDV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS25 FYPVTLRTPAGGKGLALSSNKVKSVVMVVFDNEKVPVEQLRFWKHWHSRQPTAKQRVIDV
270 280 290 300 310 320
280 290 300 310 320 330
pF1KE2 ADCKENFNTVEHIEEVAYNALSFVWNVNEEAKVFIGVNCLSTDFSSQKGVKGVPLNLQID
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS25 ADCKENFNTVEHIEEVAYNALSFVWNVNEEAKVFIGVNCLSTDFSSQKGVKGVPLNLQID
330 340 350 360 370 380
340 350 360 370 380 390
pF1KE2 TYDCGLGTERLVHRAVCQIKIFCDKGAERKMRDDERKQFRRKVKCPDSSNSGVKGCLLSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS25 TYDCGLGTERLVHRAVCQIKIFCDKGAERKMRDDERKQFRRKVKCPDSSNSGVKGCLLSG
390 400 410 420 430 440
400 410 420 430 440 450
pF1KE2 FRGNETTYLRPETDLETPPVLFIPNVHFSSLQRSGGAAPSAGPSSSNRLPLKRTCSPFTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS25 FRGNETTYLRPETDLETPPVLFIPNVHFSSLQRSGGAAPSAGPSSSNRLPLKRTCSPFTE
450 460 470 480 490 500
460 470 480 490 500 510
pF1KE2 EFEPLPSKQAKEGDLQRVLLYVRRETEEVFDALMLKTPDLKGLRNAISEKYGFPEENIYK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS25 EFEPLPSKQAKEGDLQRVLLYVRRETEEVFDALMLKTPDLKGLRNAISEKYGFPEENIYK
510 520 530 540 550 560
520 530 540 550
pF1KE2 VYKKCKRGILVNMDNNIIQHYSNHVAFLLDMGELDGKIQIILKEL
:::::::::::::::::::::::::::::::::::::::::::::
CCDS25 VYKKCKRGILVNMDNNIIQHYSNHVAFLLDMGELDGKIQIILKEL
570 580 590 600
>>CCDS252.2 GRHL3 gene_id:57822|Hs108|chr1 (626 aa)
initn: 3513 init1: 3513 opt: 3513 Z-score: 3489.9 bits: 655.7 E(32554): 4.6e-188
Smith-Waterman score: 3513; 100.0% identity (100.0% similar) in 518 aa overlap (1-518:48-565)
10 20 30
pF1KE2 MRVNGDDDSVAALSFLYDYYMGPKEKRILS
::::::::::::::::::::::::::::::
CCDS25 VNLQKFSYTSEDEAWKTYLENPLTAATKAMMRVNGDDDSVAALSFLYDYYMGPKEKRILS
20 30 40 50 60 70
40 50 60 70 80 90
pF1KE2 SSTGGRNDQGKRYYHGMEYETDLTPLESPTHLMKFLTENVSGTPEYPDLLKKNNLMSLEG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS25 SSTGGRNDQGKRYYHGMEYETDLTPLESPTHLMKFLTENVSGTPEYPDLLKKNNLMSLEG
80 90 100 110 120 130
100 110 120 130 140 150
pF1KE2 ALPTPGKAAPLPAGPSKLEAGSVDSYLLPTTDMYDNGSLNSLFESIHGVPPTQRWQPDST
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS25 ALPTPGKAAPLPAGPSKLEAGSVDSYLLPTTDMYDNGSLNSLFESIHGVPPTQRWQPDST
140 150 160 170 180 190
160 170 180 190 200 210
pF1KE2 FKDDPQESMLFPDILKTSPEPPCPEDYPSLKSDFEYTLGSPKAIHIKSGESPMAYLNKGQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS25 FKDDPQESMLFPDILKTSPEPPCPEDYPSLKSDFEYTLGSPKAIHIKSGESPMAYLNKGQ
200 210 220 230 240 250
220 230 240 250 260 270
pF1KE2 FYPVTLRTPAGGKGLALSSNKVKSVVMVVFDNEKVPVEQLRFWKHWHSRQPTAKQRVIDV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS25 FYPVTLRTPAGGKGLALSSNKVKSVVMVVFDNEKVPVEQLRFWKHWHSRQPTAKQRVIDV
260 270 280 290 300 310
280 290 300 310 320 330
pF1KE2 ADCKENFNTVEHIEEVAYNALSFVWNVNEEAKVFIGVNCLSTDFSSQKGVKGVPLNLQID
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS25 ADCKENFNTVEHIEEVAYNALSFVWNVNEEAKVFIGVNCLSTDFSSQKGVKGVPLNLQID
320 330 340 350 360 370
340 350 360 370 380 390
pF1KE2 TYDCGLGTERLVHRAVCQIKIFCDKGAERKMRDDERKQFRRKVKCPDSSNSGVKGCLLSG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS25 TYDCGLGTERLVHRAVCQIKIFCDKGAERKMRDDERKQFRRKVKCPDSSNSGVKGCLLSG
380 390 400 410 420 430
400 410 420 430 440 450
pF1KE2 FRGNETTYLRPETDLETPPVLFIPNVHFSSLQRSGGAAPSAGPSSSNRLPLKRTCSPFTE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS25 FRGNETTYLRPETDLETPPVLFIPNVHFSSLQRSGGAAPSAGPSSSNRLPLKRTCSPFTE
440 450 460 470 480 490
460 470 480 490 500 510
pF1KE2 EFEPLPSKQAKEGDLQRVLLYVRRETEEVFDALMLKTPDLKGLRNAISEKYGFPEENIYK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS25 EFEPLPSKQAKEGDLQRVLLYVRRETEEVFDALMLKTPDLKGLRNAISEKYGFPEENIYK
500 510 520 530 540 550
520 530 540 550
pF1KE2 VYKKCKRGILVNMDNNIIQHYSNHVAFLLDMGELDGKIQIILKEL
::::::::
CCDS25 VYKKCKRGETSLLHPRLSRHPPPDCLECSHPVTQVRNMGFGDGFWRQRDLDSNPSPTTVN
560 570 580 590 600 610
>>CCDS33144.2 GRHL1 gene_id:29841|Hs108|chr2 (618 aa)
initn: 1346 init1: 848 opt: 1386 Z-score: 1378.6 bits: 265.0 E(32554): 1.8e-70
Smith-Waterman score: 1472; 44.8% identity (68.7% similar) in 578 aa overlap (1-555:49-618)
10 20 30
pF1KE2 MRVNGDDDSVAALSFLYDYYMGPKEKRILS
: .:::.::.:::..::::: :.:.: .
CCDS33 LYPQRRSYTSEDEAWKSFLENPLTAATKAMMSINGDEDSAAALGLLYDYYKVPRERRSST
20 30 40 50 60 70
40 50 60 70
pF1KE2 SSTGGRN---DQGKRYYHGMEYETDL-TPLESPTHLMKFLTENVS-------GTPEYPDL
.. .. :..:: . : : . :. ....: . :. : . :
CCDS33 AKPEVEHPEPDHSKRNSIPIVTEQPLISAGENRVQVLKNVPFNIVLPHGNQLGIDKRGHL
80 90 100 110 120 130
80 90 100 110 120 130
pF1KE2 LKKNNLMSLEGALPTPGKAAPLPAGPSKLEAGSVDSYLLPTTD----MYDNGSLNSLFES
.. ... : : .. . : . .: . : ..: . .. : :
CCDS33 TAPDTTVTVSIAT-MPTHSIKTETQPHGFAVGIPPAVYHPEPTERVVVFDRNLNTDQFSS
140 150 160 170 180 190
140 150 160 170 180
pF1KE2 IHGVPPTQRWQPDSTFKDDPQESM---LFPDILKTSPEPPCPEDY--PSLK-SDFEYTLG
.: .:: :::::.. .:.. .::. :. ::: :.. ..:::::
CCDS33 GAQAPNAQRRTPDSTFSETFKEGVQEVFFPSDLSLRMPGMNSEDYVFDSVSGNNFEYTLE
200 210 220 230 240 250
190 200 210 220 230 240
pF1KE2 SPKAIHIKSGESPMAYLNKGQFYPVTLRTPAGGKGLALSSNKVKSVVMVVFDNEKVPVEQ
. :... : :.: :.:::::::::.::. ....:. .::.::.:::: ..: .:
CCDS33 ASKSLRQKPGDSTMTYLNKGQFYPITLKEVSSSEGIHHPISKVRSVIMVVFAEDKSREDQ
260 270 280 290 300 310
250 260 270 280 290 300
pF1KE2 LRFWKHWHSRQPTAKQRVIDVADCKENFNTVEHIEEVAYNALSFVWNVNEEAKVFIGVNC
:: ::.::::: ::::: ::.:: ::.:::. .:::.::::.::.:..:.::::::.:::
CCDS33 LRHWKYWHSRQHTAKQRCIDIADYKESFNTISNIEEIAYNAISFTWDINDEAKVFISVNC
320 330 340 350 360 370
310 320 330 340 350 360
pF1KE2 LSTDFSSQKGVKGVPLNLQIDTYDCGLGTERLVHRAVCQIKIFCDKGAERKMRDDERKQF
:::::::::::::.:::.:.:::. . ... :::: ::::.:::::::::.::.::::
CCDS33 LSTDFSSQKGVKGLPLNIQVDTYSYNNRSNKPVHRAYCQIKVFCDKGAERKIRDEERKQS
380 390 400 410 420 430
370 380 390 400 410 420
pF1KE2 RRKVKCPDSSNSGVKGCLLSGFRGNETTYLRPETDLETPPVLFIPNVHFSSLQRSGGAAP
.::: : :: :: . . . : ..: ::.: ::::::.:::..:::. . :
CCDS33 KRKV-------SDVKVPLLPSHKRMDITVFKPFIDLDTQPVLFIPDVHFANLQRGTHVLP
440 450 460 470 480 490
430 440 450 460 470 480
pF1KE2 SAGPSSSNRLP-LKRTCSPFTEEFEPLPS-KQAKEGDLQRVLLYVRRETEEVFDALMLKT
:. .. ::: ..: :: : :. . .:::::::.:.:::::::::::
CCDS33 IASEELEGEGSVLKRGPYGTEDDFAVPPSTKLARIEEPKRVLLYVRKESEEVFDALMLKT
500 510 520 530 540 550
490 500 510 520 530 540
pF1KE2 PDLKGLRNAISEKYGFPEENIYKVYKKCKRGILVNMDNNIIQHYSNHVAFLLDMGELDGK
:.:::: .:::.:: :...: :..::::.:::::::.::..::::. .: :.. : :.
CCDS33 PSLKGLMEAISDKYDVPHDKIGKIFKKCKKGILVNMDDNIVKHYSNEDTFQLQIEEAGGS
560 570 580 590 600 610
550
pF1KE2 IQIILKEL
.. : :.
CCDS33 YKLTLTEI
>>CCDS83312.1 GRHL2 gene_id:79977|Hs108|chr8 (609 aa)
initn: 1492 init1: 815 opt: 1369 Z-score: 1361.8 bits: 261.9 E(32554): 1.6e-69
Smith-Waterman score: 1502; 44.8% identity (70.7% similar) in 583 aa overlap (1-555:36-609)
10 20 30
pF1KE2 MRVNGDDDSVAALSFLYDYYMGPKEKRILS
: .:::.::.:::..::::: :..::.::
CCDS83 PFNTRRAYTSEDEAWKSYLENPLTAATKAMMSINGDEDSAAALGLLYDYYKVPRDKRLLS
10 20 30 40 50 60
40 50 60 70 80
pF1KE2 SS--TGGRNDQGKRYYHGM-EYETDLTPLESPTHLMKFLTENVSGTPEYPDLLKKNNLMS
: . ...:: :: : : ...:. :. ....: . :.: . .. . :...
CCDS83 VSKASDSQEDQEKRNCLGTSEAQSNLSGGENRVQVLKTVPVNLSLNQDHLENSKREQY--
70 80 90 100 110 120
90 100 110 120 130 140
pF1KE2 LEGALPTPGKAAPLP-AGPSKLEAGSVDSYLLPTTDMYDNGSLNS----LFESI-HGVPP
.. : ..: .: .: . ..: . .. : :. . .::. . ::
CCDS83 ---SISFPESSAIIPVSGITVVKAEDFTPVFMAPPVHYPRGDGEEQRVVIFEQTQYDVPS
130 140 150 160 170 180
150 160 170 180 190
pF1KE2 T----------QRWQPDSTFKDDPQESMLFPDILKTSPEPPCPEDYPSLKSD-FEYTLGS
:: ::::.... ... . .... : . .: :.::: .
CCDS83 LATHSAYLKDDQRSTPDSTYSESFKDAA--TEKFRSASVGAEEYMYDQTSSGTFQYTLEA
190 200 210 220 230
200 210 220 230 240 250
pF1KE2 PKAIHIKSGESPMAYLNKGQFYPVTLRTPAGGKGLALSSNKVKSVVMVVFDNEKVPVEQL
:... :.::.::.:::::::: .:: . .: . .::.:::::::...: :::
CCDS83 TKSLRQKQGEGPMTYLNKGQFYAITLSETGDNKCFRHPISKVRSVVMVVFSEDKNRDEQL
240 250 260 270 280 290
260 270 280 290 300 310
pF1KE2 RFWKHWHSRQPTAKQRVIDVADCKENFNTVEHIEEVAYNALSFVWNVNEEAKVFIGVNCL
..::.::::: ::::::.:.:: ::.:::. .:::.::::.::.:.::::::.:: ::::
CCDS83 KYWKYWHSRQHTAKQRVLDIADYKESFNTIGNIEEIAYNAVSFTWDVNEEAKIFITVNCL
300 310 320 330 340 350
320 330 340 350 360 370
pF1KE2 STDFSSQKGVKGVPLNLQIDTYDCGLGTERLVHRAVCQIKIFCDKGAERKMRDDERKQFR
::::::::::::.:: .:::::. . ... .::: ::::.:::::::::.::.:::: :
CCDS83 STDFSSQKGVKGLPLMIQIDTYSYNNRSNKPIHRAYCQIKVFCDKGAERKIRDEERKQNR
360 370 380 390 400 410
380 390 400 410 420
pF1KE2 RKVK-------CPDSSNSGVKGCLLSGFRGNETTYLRPETDLETPPVLFIPNVHFSSLQR
.: : : .::.. . . :. . .. ::.. ::.. ::::::.:::..:::
CCDS83 KKGKGQASQTQCNSSSDGKLAAIPLQ--KKSDITYFKTMPDLHSQPVLFIPDVHFANLQR
420 430 440 450 460 470
430 440 450 460 470 480
pF1KE2 SGGAAPSAGPSS-SNRLPLKRTCSPFTEEFEPLPSKQAKEGDLQRVLLYVRRETEEVFDA
.: . .. .. . .:: :. ::: :.:::: :: .:::::::.::..::::
CCDS83 TGQVYYNTDDEREGGSVLVKRMFRPMEEEFGPVPSKQMKEEGTKRVLLYVRKETDDVFDA
480 490 500 510 520 530
490 500 510 520 530 540
pF1KE2 LMLKTPDLKGLRNAISEKYGFPEENIYKVYKKCKRGILVNMDNNIIQHYSNHVAFLLDMG
::::.: .::: .:::::::.: :.: :.::: :.:::::::.:::.::::. .:.:.:
CCDS83 LMLKSPTVKGLMEAISEKYGLPVEKIAKLYKKSKKGILVNMDDNIIEHYSNEDTFILNME
540 550 560 570 580 590
550
pF1KE2 ELDGKIQIILKEL
. ... : :.
CCDS83 SMVEGFKVTLMEI
600
>>CCDS34931.1 GRHL2 gene_id:79977|Hs108|chr8 (625 aa)
initn: 1492 init1: 815 opt: 1369 Z-score: 1361.6 bits: 261.9 E(32554): 1.6e-69
Smith-Waterman score: 1502; 44.8% identity (70.7% similar) in 583 aa overlap (1-555:52-625)
10 20 30
pF1KE2 MRVNGDDDSVAALSFLYDYYMGPKEKRILS
: .:::.::.:::..::::: :..::.::
CCDS34 PFNTRRAYTSEDEAWKSYLENPLTAATKAMMSINGDEDSAAALGLLYDYYKVPRDKRLLS
30 40 50 60 70 80
40 50 60 70 80
pF1KE2 SS--TGGRNDQGKRYYHGM-EYETDLTPLESPTHLMKFLTENVSGTPEYPDLLKKNNLMS
: . ...:: :: : : ...:. :. ....: . :.: . .. . :...
CCDS34 VSKASDSQEDQEKRNCLGTSEAQSNLSGGENRVQVLKTVPVNLSLNQDHLENSKREQY--
90 100 110 120 130
90 100 110 120 130 140
pF1KE2 LEGALPTPGKAAPLP-AGPSKLEAGSVDSYLLPTTDMYDNGSLNS----LFESI-HGVPP
.. : ..: .: .: . ..: . .. : :. . .::. . ::
CCDS34 ---SISFPESSAIIPVSGITVVKAEDFTPVFMAPPVHYPRGDGEEQRVVIFEQTQYDVPS
140 150 160 170 180 190
150 160 170 180 190
pF1KE2 T----------QRWQPDSTFKDDPQESMLFPDILKTSPEPPCPEDYPSLKSD-FEYTLGS
:: ::::.... ... . .... : . .: :.::: .
CCDS34 LATHSAYLKDDQRSTPDSTYSESFKDAA--TEKFRSASVGAEEYMYDQTSSGTFQYTLEA
200 210 220 230 240 250
200 210 220 230 240 250
pF1KE2 PKAIHIKSGESPMAYLNKGQFYPVTLRTPAGGKGLALSSNKVKSVVMVVFDNEKVPVEQL
:... :.::.::.:::::::: .:: . .: . .::.:::::::...: :::
CCDS34 TKSLRQKQGEGPMTYLNKGQFYAITLSETGDNKCFRHPISKVRSVVMVVFSEDKNRDEQL
260 270 280 290 300 310
260 270 280 290 300 310
pF1KE2 RFWKHWHSRQPTAKQRVIDVADCKENFNTVEHIEEVAYNALSFVWNVNEEAKVFIGVNCL
..::.::::: ::::::.:.:: ::.:::. .:::.::::.::.:.::::::.:: ::::
CCDS34 KYWKYWHSRQHTAKQRVLDIADYKESFNTIGNIEEIAYNAVSFTWDVNEEAKIFITVNCL
320 330 340 350 360 370
320 330 340 350 360 370
pF1KE2 STDFSSQKGVKGVPLNLQIDTYDCGLGTERLVHRAVCQIKIFCDKGAERKMRDDERKQFR
::::::::::::.:: .:::::. . ... .::: ::::.:::::::::.::.:::: :
CCDS34 STDFSSQKGVKGLPLMIQIDTYSYNNRSNKPIHRAYCQIKVFCDKGAERKIRDEERKQNR
380 390 400 410 420 430
380 390 400 410 420
pF1KE2 RKVK-------CPDSSNSGVKGCLLSGFRGNETTYLRPETDLETPPVLFIPNVHFSSLQR
.: : : .::.. . . :. . .. ::.. ::.. ::::::.:::..:::
CCDS34 KKGKGQASQTQCNSSSDGKLAAIPLQ--KKSDITYFKTMPDLHSQPVLFIPDVHFANLQR
440 450 460 470 480 490
430 440 450 460 470 480
pF1KE2 SGGAAPSAGPSS-SNRLPLKRTCSPFTEEFEPLPSKQAKEGDLQRVLLYVRRETEEVFDA
.: . .. .. . .:: :. ::: :.:::: :: .:::::::.::..::::
CCDS34 TGQVYYNTDDEREGGSVLVKRMFRPMEEEFGPVPSKQMKEEGTKRVLLYVRKETDDVFDA
500 510 520 530 540 550
490 500 510 520 530 540
pF1KE2 LMLKTPDLKGLRNAISEKYGFPEENIYKVYKKCKRGILVNMDNNIIQHYSNHVAFLLDMG
::::.: .::: .:::::::.: :.: :.::: :.:::::::.:::.::::. .:.:.:
CCDS34 LMLKSPTVKGLMEAISEKYGLPVEKIAKLYKKSKKGILVNMDDNIIEHYSNEDTFILNME
560 570 580 590 600 610
550
pF1KE2 ELDGKIQIILKEL
. ... : :.
CCDS34 SMVEGFKVTLMEI
620
>>CCDS2134.1 TFCP2L1 gene_id:29842|Hs108|chr2 (479 aa)
initn: 189 init1: 97 opt: 352 Z-score: 353.8 bits: 75.1 E(32554): 2.2e-13
Smith-Waterman score: 360; 24.4% identity (54.3% similar) in 438 aa overlap (156-531:21-452)
130 140 150 160 170 180
pF1KE2 NGSLNSLFESIHGVPPTQRWQPDSTFKDDPQESMLFPDILKTSPEPPCPEDYPSLKSDFE
.. . .: :.: ::. : ..
CCDS21 MLFWHTQPEHYNQHNSGSYLRDVLALP-IFKQEEPQLSPENEARLPP-LQ
10 20 30 40
190 200 210 220 230 240
pF1KE2 YTLGSPKAIHIKSGESPMAYLNKGQFYPVTL-RTPAGGKGLALSSNKVKSVVMVVFDNEK
:.: . . .: : ..:::.:: : . : .. : :... :::.. ::: ...
CCDS21 YVLCAATSPAVKLHEETLTYLNQGQSYEIRLLENRKLGDFQDLNTKYVKSIIRVVFHDRR
50 60 70 80 90 100
250 260 270 280 290 300
pF1KE2 VPVEQLRFWKHWHSRQPTAKQRVIDVADCKENFNTVE-HIEEVAYNALSFVWNVNEEAKV
. . . . :. .: .:..:. : . . .. . . ::. :.:. ..:..
CCDS21 LQYTEHQQLEGWRWSRP--GDRILDI-DIPLSVGILDPRASPTQLNAVEFLWDPAKRASA
110 120 130 140 150 160
310 320 330 340 350
pF1KE2 FIGVNCLSTDFSSQK--GVKGVPLNLQIDTY---DCGLGTERLVHRAVCQIKIFCDKGAE
:: :.:.::.:. .: : ::::. .::::. . : ::.: : : ::::.: :::.
CCDS21 FIQVHCISTEFTPRKHGGEKGVPFRVQIDTFKQNENGEYTEHL-HSASCQIKVFKPKGAD
170 180 190 200 210 220
360 370 380 390
pF1KE2 RKMRDDERKQFRRKVKCPDSSNSGVKGCLLS------------------GFRGNETTY--
::.. :..:. .: .. .. . . . .:. .. :. ...
CCDS21 RKQKTDREKMEKRTAQEKEKYQPSYETTILTECSPWPDVAYQVNSAPSPSYNGSPNSFGL
230 240 250 260 270 280
400 410 420 430
pF1KE2 ----LRPETDLETPPV---LFIPN---------VH---FSSLQRSGGAAPSAGPSSSNRL
: .:. :: ..:. .: ::.. : .. .: . .:
CCDS21 GEGNASPTHPVEALPVGSDHLLPSASIQDAQQWLHRNRFSQFCRLFASFSGADLLKMSRD
290 300 310 320 330 340
440 450 460 470 480
pF1KE2 PLKRTCSPFT--EEFEPLPSKQAK---------EGDLQRVLLYVRRETE-----EVFDAL
: . :.: . :. . ..... : . .:: : .:. :. :.
CCDS21 DLVQICGPADGIRLFNAIKGRNVRPKMTIYVCQELEQNRVPLQQKRDGSGDSNLSVYHAI
350 360 370 380 390 400
490 500 510 520 530 540
pF1KE2 MLKTPDLKGLRNAISEKYGFPEENIYKVYKKCKRGILVNMDNNIIQHYSNHVAFLLDMGE
.:. : . :.. :.. ..:..::.. :: : ..:...:..
CCDS21 FLEELTTLELIEKIANLYSISPQHIHRVYRQGPTGIHVVVSNEMVQNFQDESCFVLSTIK
410 420 430 440 450 460
550
pF1KE2 LDGKIQIILKEL
CCDS21 AESNDGYHIILKCGL
470
>>CCDS46788.1 UBP1 gene_id:7342|Hs108|chr3 (504 aa)
initn: 205 init1: 96 opt: 351 Z-score: 352.5 bits: 74.9 E(32554): 2.6e-13
Smith-Waterman score: 351; 28.5% identity (59.9% similar) in 274 aa overlap (174-437:54-314)
150 160 170 180 190 200
pF1KE2 RWQPDSTFKDDPQESMLFPDILKTSPEPPCPEDYPSLKSDFEYTLGSPKAIHIKSGESPM
: : . . :.:.. . . .: . .
CCDS46 SGIGQELGAGAYSMSDVLALPIFKQEDSSLPLDGETEHPPFQYVMCAATSPAVKLHDETL
30 40 50 60 70 80
210 220 230 240 250
pF1KE2 AYLNKGQFYPVT-LRTPAGGKGLALSSNKVKSVVMVVFDNEKVPV---EQLRFWKHWHSR
.:::.:: : . : . : .... :::.. ::: .... .::. :: :.
CCDS46 TYLNQGQSYEIRMLDNRKMGDMPEINGKLVKSIIRVVFHDRRLQYTEHQQLEGWK-WN--
90 100 110 120 130 140
260 270 280 290 300 310
pF1KE2 QPTAKQRVIDVADCKENFNTVE-HIEEVAYNALSFVWNVNEEAKVFIGVNCLSTDFSSQK
.: .:..:. : . . .. . . ::. :.:. .....:: :.:.::.:. .:
CCDS46 RP--GDRLLDL-DIPMSVGIIDTRTNPSQLNAVEFLWDPAKRTSAFIQVHCISTEFTPRK
150 160 170 180 190
320 330 340 350 360 370
pF1KE2 --GVKGVPLNLQIDTY---DCGLGTERLVHRAVCQIKIFCDKGAERKMRDDERKQFRRKV
: ::::. .:.::. . : :..: : : ::::.: :::.::.. :..:. .: .
CCDS46 HGGEKGVPFRIQVDTFKQNENGEYTDHL-HSASCQIKVFKPKGADRKQKTDREKMEKRTA
200 210 220 230 240 250
380 390 400 410 420 430
pF1KE2 KCPDSSNSGVKGCLLSGFRGNETTYLRPETDLETPPVLFIPNVHFSSLQRSGGAAPSAGP
. .. . . .:. . : . ... : : :.: :.: ..:...
CCDS46 HEKEKYQPSYDTTILTECSPWPDA---PTAYVNNSPS---PAPTFTSPQQSTCSVPDSNS
260 270 280 290 300 310
440 450 460 470 480 490
pF1KE2 SSSNRLPLKRTCSPFTEEFEPLPSKQAKEGDLQRVLLYVRRETEEVFDALMLKTPDLKGL
:: :
CCDS46 SSPNHQGDGASQTSGEQIQPSATIQETQQWLLKNRFSSYTRLFSNFSGADLLKLTKEDLV
320 330 340 350 360 370
>>CCDS2659.1 UBP1 gene_id:7342|Hs108|chr3 (540 aa)
initn: 230 init1: 121 opt: 347 Z-score: 348.0 bits: 74.2 E(32554): 4.6e-13
Smith-Waterman score: 355; 27.2% identity (57.1% similar) in 294 aa overlap (174-446:54-340)
150 160 170 180 190 200
pF1KE2 RWQPDSTFKDDPQESMLFPDILKTSPEPPCPEDYPSLKSDFEYTLGSPKAIHIKSGESPM
: : . . :.:.. . . .: . .
CCDS26 SGIGQELGAGAYSMSDVLALPIFKQEDSSLPLDGETEHPPFQYVMCAATSPAVKLHDETL
30 40 50 60 70 80
210 220 230 240 250
pF1KE2 AYLNKGQFYPVT-LRTPAGGKGLALSSNKVKSVVMVVFDNEKVPV---EQLRFWKHWHSR
.:::.:: : . : . : .... :::.. ::: .... .::. :: :.
CCDS26 TYLNQGQSYEIRMLDNRKMGDMPEINGKLVKSIIRVVFHDRRLQYTEHQQLEGWK-WN--
90 100 110 120 130 140
260 270 280 290 300 310
pF1KE2 QPTAKQRVIDVADCKENFNTVE-HIEEVAYNALSFVWNVNEEAKVFIGVNCLSTDFSSQK
.: .:..:. : . . .. . . ::. :.:. .....:: :.:.::.:. .:
CCDS26 RP--GDRLLDL-DIPMSVGIIDTRTNPSQLNAVEFLWDPAKRTSAFIQVHCISTEFTPRK
150 160 170 180 190
320 330 340 350 360 370
pF1KE2 --GVKGVPLNLQIDTY---DCGLGTERLVHRAVCQIKIFCDKGAERKMRDDERKQFRRKV
: ::::. .:.::. . : :..: : : ::::.: :::.::.. :..:. .: .
CCDS26 HGGEKGVPFRIQVDTFKQNENGEYTDHL-HSASCQIKVFKPKGADRKQKTDREKMEKRTA
200 210 220 230 240 250
380 390 400 410 420
pF1KE2 KCPDSSNSGVKGCLLSGFRGNETTYLRPETDLETPPVLFIPNVHFSSLQRSGGAAP----
. .. . . .:. .: . : . . .: . .:: . :. .:
CCDS26 HEKEKYQPSYDTTILTEMRLEPIIEDAVEHEQKKSSKRTLPADYGDSLAKRGSCSPWPDA
260 270 280 290 300 310
430 440 450 460 470 480
pF1KE2 -------SAGPSSSNRLPLKRTCSPFTEEFEPLPSKQAKEGDLQRVLLYVRRETEEVFDA
: .:. . : . :::
CCDS26 PTAYVNNSPSPAPTFTSPQQSTCSVPDSNSSSPNHQGDGASQTSGEQIQPSATIQETQQW
320 330 340 350 360 370
555 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 03:15:20 2016 done: Tue Nov 8 03:15:20 2016
Total Scan time: 2.860 Total Display time: 0.080
Function used was FASTA [36.3.4 Apr, 2011]