FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB7765, 450 aa
1>>>pF1KB7765 450 - 450 aa - 450 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 8.2772+/-0.00092; mu= 5.0690+/- 0.055
mean_var=173.8064+/-36.010, 0's: 0 Z-trim(112.1): 14 B-trim: 332 in 1/52
Lambda= 0.097284
statistics sampled from 12939 (12947) to 12939 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.742), E-opt: 0.2 (0.398), width: 16
Scan time: 3.540
The best scores are: opt bits E(32554)
CCDS13454.1 TFAP2C gene_id:7022|Hs108|chr20 ( 450) 3038 438.4 7.2e-123
CCDS4934.2 TFAP2B gene_id:7021|Hs108|chr6 ( 460) 1653 244.0 2.4e-64
CCDS34337.1 TFAP2A gene_id:7020|Hs108|chr6 ( 431) 1468 218.0 1.5e-56
CCDS43422.1 TFAP2A gene_id:7020|Hs108|chr6 ( 433) 1468 218.0 1.5e-56
CCDS4510.1 TFAP2A gene_id:7020|Hs108|chr6 ( 437) 1468 218.0 1.5e-56
CCDS393.2 TFAP2E gene_id:339488|Hs108|chr1 ( 442) 1367 203.8 2.8e-52
CCDS4933.1 TFAP2D gene_id:83741|Hs108|chr6 ( 452) 1008 153.5 4.2e-37
>>CCDS13454.1 TFAP2C gene_id:7022|Hs108|chr20 (450 aa)
initn: 3038 init1: 3038 opt: 3038 Z-score: 2319.4 bits: 438.4 E(32554): 7.2e-123
Smith-Waterman score: 3038; 100.0% identity (100.0% similar) in 450 aa overlap (1-450:1-450)
10 20 30 40 50 60
pF1KB7 MLWKITDNVKYEEDCEDRHDGSSNGNPRVPHLSSAGQHLYSPAPPLSHTGVAEYQPPPYF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 MLWKITDNVKYEEDCEDRHDGSSNGNPRVPHLSSAGQHLYSPAPPLSHTGVAEYQPPPYF
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB7 PPPYQQLAYSQSADPYSHLGEAYAAAINPLHQPAPTGSQQQAWPGRQSQEGAGLPSHHGR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 PPPYQQLAYSQSADPYSHLGEAYAAAINPLHQPAPTGSQQQAWPGRQSQEGAGLPSHHGR
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB7 PAGLLPHLSGLEAGAVSARRDAYRRSDLLLPHAHALDAAGLAENLGLHDMPHQMDEVQNV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 PAGLLPHLSGLEAGAVSARRDAYRRSDLLLPHAHALDAAGLAENLGLHDMPHQMDEVQNV
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB7 DDQHLLLHDQTVIRKGPISMTKNPLNLPCQKELVGAVMNPTEVFCSVPGRLSLLSSTSKY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 DDQHLLLHDQTVIRKGPISMTKNPLNLPCQKELVGAVMNPTEVFCSVPGRLSLLSSTSKY
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB7 KVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLREKLDKIGLNLPAGRRKAAHVT
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 KVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLREKLDKIGLNLPAGRRKAAHVT
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB7 LLTSLVEGEAVHLARDFAYVCEAEFPSKPVAEYLTRPHLGGRNEMAARKNMLLAAQQLCK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 LLTSLVEGEAVHLARDFAYVCEAEFPSKPVAEYLTRPHLGGRNEMAARKNMLLAAQQLCK
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB7 EFTELLSQDRTPHGTSRLAPVLETNIQNCLSHFSLITHGFGSQAICAAVSALQNYIKEAL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS13 EFTELLSQDRTPHGTSRLAPVLETNIQNCLSHFSLITHGFGSQAICAAVSALQNYIKEAL
370 380 390 400 410 420
430 440 450
pF1KB7 IVIDKSYMNPGDQSPADSNKTLEKMEKHRK
::::::::::::::::::::::::::::::
CCDS13 IVIDKSYMNPGDQSPADSNKTLEKMEKHRK
430 440 450
>>CCDS4934.2 TFAP2B gene_id:7021|Hs108|chr6 (460 aa)
initn: 1468 init1: 685 opt: 1653 Z-score: 1268.7 bits: 244.0 E(32554): 2.4e-64
Smith-Waterman score: 1653; 59.6% identity (77.2% similar) in 465 aa overlap (1-450:12-460)
10 20 30 40
pF1KB7 MLWKITDNVKYEEDCEDRHDGSSNGNPRVPHLSSAGQHLYSPAPPLSHT
::::...:::::. :::::: . . :. .:.:..: :: :::::::
CCDS49 MHSPPRDQAAIMLWKLVENVKYEDIYEDRHDGVPSHSSRLSQLGSVSQGPYSSAPPLSHT
10 20 30 40 50 60
50 60 70 80 90 100
pF1KB7 GVAEYQPPPYFPPPYQQLAYSQSADPYSHLGEAYAAAINPLHQPAPTGSQQQAWPGRQSQ
...::: ::::::: : : :: :::::... :. .:::::: ::. : :: :
CCDS49 PSSDFQPP-YFPPPYQPLPYHQSQDPYSHVNDPYS--LNPLHQP-----QQHPWGQRQRQ
70 80 90 100 110
110 120 130 140 150 160
pF1KB7 E-GAGLPSHHGRPAGLLPHLSGLEAGAVSARRDAY--RRSDLLLPHAH-ALDAAGLAENL
: :. : .: . ::.::::. ::: . :: :.:: :: .::: :....:
CCDS49 EVGSEAGSLLPQPRAALPQLSGLDP-----RRDYHSVRRPDVLLHSAHHGLDA-GMGDSL
120 130 140 150 160
170 180 190 200 210
pF1KB7 GLHDMPHQ-MDEVQNVDDQH---LLLHDQTVIRKGPISMTKNPLNLPCQKE--LVGAVMN
.:: . : :..::.:.: . . : ::.::.: :. :. .: .:. : : .:
CCDS49 SLHGLGHPGMEDVQSVEDANNSGMNLLDQSVIKKVPVP-PKSVTSLMMNKDGFLGGMSVN
170 180 190 200 210 220
220 230 240 250 260 270
pF1KB7 PTEVFCSVPGRLSLLSSTSKYKVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLR
:::::::::::::::::::::::.::::::::::::::::::::::::::::::::::
CCDS49 TGEVFCSVPGRLSLLSSTSKYKVTVGEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLR
230 240 250 260 270 280
280 290 300 310 320 330
pF1KB7 EKLDKIGLNLPAGRRKAAHVTLLTSLVEGEAVHLARDFAYVCEAEFPSKPVAEYLTRPHL
:.:.::::::::::::::.:::::::::::::::::::.:.::.:::.: :.:::.: :
CCDS49 ERLEKIGLNLPAGRRKAANVTLLTSLVEGEAVHLARDFGYICETEFPAKAVSEYLNRQHT
290 300 310 320 330 340
340 350 360 370 380 390
pF1KB7 GGRNEMAARKNMLLAAQQLCKEFTELLSQDRTPHGTSRLAPVLETNIQNCLSHFSLITHG
... .:::::::..:::::::.::.::::: :.:: .:.:: .::.::.::::::::
CCDS49 DP-SDLHSRKNMLLATKQLCKEFTDLLAQDRTPIGNSRPSPILEPGIQSCLTHFSLITHG
350 360 370 380 390 400
400 410 420 430 440 450
pF1KB7 FGSQAICAAVSALQNYIKEALIVIDKSYMNPGDQSPADS-----NKTLEKMEKHRK
::. :::::..:::::. ::: .:: ..: . : .:: .: :::::
CCDS49 FGAPAICAALTALQNYLTEALKGMDKMFLNNTTTNRHTSGEGPGSKTGDKEEKHRK
410 420 430 440 450 460
>>CCDS34337.1 TFAP2A gene_id:7020|Hs108|chr6 (431 aa)
initn: 1551 init1: 743 opt: 1468 Z-score: 1128.8 bits: 218.0 E(32554): 1.5e-56
Smith-Waterman score: 1740; 63.4% identity (82.6% similar) in 443 aa overlap (17-450:10-431)
10 20 30 40 50 60
pF1KB7 MLWKITDNVKYEEDCEDRHDGSSNGNPRVPHLSSAGQHLYSPAPPLSHTGVAEYQPPPYF
:::::.:::. :.:.:...:: :. ::::::: :..::: ::
CCDS34 MLVHSFSAMDRHDGTSNGTARLPQLGTVGQSPYTSAPPLSHTPNADFQPP-YF
10 20 30 40 50
70 80 90 100 110
pF1KB7 PPPYQQLAYSQSADPYSHLGEAYAAAINPLH-QPAPTGSQQQAWPG-RQSQEGAGLPSHH
::::: . : :: :::::... :. .:::: :: : :. .::: :::::.. : .:.
CCDS34 PPPYQPI-YPQSQDPYSHVNDPYS--LNPLHAQPQP---QHPGWPGQRQSQESGLLHTHR
60 70 80 90 100
120 130 140 150 160 170
pF1KB7 GRPAGLLPH-LSGLEAGAVSARRDAYRRSDLLLPHAHALDAAGLAENLGLHDMPHQMDEV
: ::: ::::. ::: ::: . :: ::: ..::.. :..:..:: ..::
CCDS34 G-----LPHQLSGLD-----PRRD-YRRHEDLLHGPHAL-SSGLGD-LSIHSLPHAIEEV
110 120 130 140 150
180 190 200 210 220 230
pF1KB7 QNVDDQHLLLHDQTVIRKGPISMTKNPLN----LPCQKE-LVGAVMNPTEVFCSVPGRLS
.:.: . . :::::.:::.:..:. : .: .:. : :.:.::.:::::::::::
CCDS34 PHVEDPGINIPDQTVIKKGPVSLSKSNSNAVSAIPINKDNLFGGVVNPNEVFCSVPGRLS
160 170 180 190 200 210
240 250 260 270 280 290
pF1KB7 LLSSTSKYKVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLREKLDKIGLNLPAG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS34 LLSSTSKYKVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLREKLDKIGLNLPAG
220 230 240 250 260 270
300 310 320 330 340 350
pF1KB7 RRKAAHVTLLTSLVEGEAVHLARDFAYVCEAEFPSKPVAEYLTRPHLGGRNEMAARKNML
:::::.:::::::::::::::::::.::::.:::.: :::.:.: : . ::...:::::
CCDS34 RRKAANVTLLTSLVEGEAVHLARDFGYVCETEFPAKAVAEFLNRQH-SDPNEQVTRKNML
280 290 300 310 320 330
360 370 380 390 400 410
pF1KB7 LAAQQLCKEFTELLSQDRTPHGTSRLAPVLETNIQNCLSHFSLITHGFGSQAICAAVSAL
::..:.:::::.::.:::.: :.:: :.:: .::.::.::.::.::::: :.::::.::
CCDS34 LATKQICKEFTDLLAQDRSPLGNSRPNPILEPGIQSCLTHFNLISHGFGSPAVCAAVTAL
340 350 360 370 380 390
420 430 440 450
pF1KB7 QNYIKEALIVIDKSYMNPGDQSPADSN-KTLEKMEKHRK
:::. ::: ..:: :.. . .: .:.: :. .: :::::
CCDS34 QNYLTEALKAMDKMYLSNNPNSHTDNNAKSSDKEEKHRK
400 410 420 430
>>CCDS43422.1 TFAP2A gene_id:7020|Hs108|chr6 (433 aa)
initn: 1553 init1: 743 opt: 1468 Z-score: 1128.7 bits: 218.0 E(32554): 1.5e-56
Smith-Waterman score: 1745; 63.2% identity (82.5% similar) in 446 aa overlap (14-450:9-433)
10 20 30 40 50 60
pF1KB7 MLWKITDNVKYEEDCEDRHDGSSNGNPRVPHLSSAGQHLYSPAPPLSHTGVAEYQPPPYF
: .:::::.:::. :.:.:...:: :. ::::::: :..::: ::
CCDS43 MSILAKMGDWQDRHDGTSNGTARLPQLGTVGQSPYTSAPPLSHTPNADFQPP-YF
10 20 30 40 50
70 80 90 100 110
pF1KB7 PPPYQQLAYSQSADPYSHLGEAYAAAINPLH-QPAPTGSQQQAWPG-RQSQEGAGLPSHH
::::: . : :: :::::... : ..:::: :: : :. .::: :::::.. : .:.
CCDS43 PPPYQPI-YPQSQDPYSHVNDPY--SLNPLHAQPQP---QHPGWPGQRQSQESGLLHTHR
60 70 80 90 100
120 130 140 150 160 170
pF1KB7 GRPAGLLPH-LSGLEAGAVSARRDAYRRSDLLLPHAHALDAAGLAENLGLHDMPHQMDEV
: ::: ::::. ::: ::: . :: ::: ..::.. :..:..:: ..::
CCDS43 G-----LPHQLSGLDP-----RRD-YRRHEDLLHGPHAL-SSGLGD-LSIHSLPHAIEEV
110 120 130 140 150
180 190 200 210 220 230
pF1KB7 QNVDDQHLLLHDQTVIRKGPISMTKNPLN----LPCQKE-LVGAVMNPTEVFCSVPGRLS
.:.: . . :::::.:::.:..:. : .: .:. : :.:.::.:::::::::::
CCDS43 PHVEDPGINIPDQTVIKKGPVSLSKSNSNAVSAIPINKDNLFGGVVNPNEVFCSVPGRLS
160 170 180 190 200 210
240 250 260 270 280 290
pF1KB7 LLSSTSKYKVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLREKLDKIGLNLPAG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS43 LLSSTSKYKVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLREKLDKIGLNLPAG
220 230 240 250 260 270
300 310 320 330 340 350
pF1KB7 RRKAAHVTLLTSLVEGEAVHLARDFAYVCEAEFPSKPVAEYLTRPHLGGRNEMAARKNML
:::::.:::::::::::::::::::.::::.:::.: :::.:.: : . ::...:::::
CCDS43 RRKAANVTLLTSLVEGEAVHLARDFGYVCETEFPAKAVAEFLNRQH-SDPNEQVTRKNML
280 290 300 310 320 330
360 370 380 390 400 410
pF1KB7 LAAQQLCKEFTELLSQDRTPHGTSRLAPVLETNIQNCLSHFSLITHGFGSQAICAAVSAL
::..:.:::::.::.:::.: :.:: :.:: .::.::.::.::.::::: :.::::.::
CCDS43 LATKQICKEFTDLLAQDRSPLGNSRPNPILEPGIQSCLTHFNLISHGFGSPAVCAAVTAL
340 350 360 370 380 390
420 430 440 450
pF1KB7 QNYIKEALIVIDKSYMNPGDQSPADSN-KTLEKMEKHRK
:::. ::: ..:: :.. . .: .:.: :. .: :::::
CCDS43 QNYLTEALKAMDKMYLSNNPNSHTDNNAKSSDKEEKHRK
400 410 420 430
>>CCDS4510.1 TFAP2A gene_id:7020|Hs108|chr6 (437 aa)
initn: 1552 init1: 743 opt: 1468 Z-score: 1128.7 bits: 218.0 E(32554): 1.5e-56
Smith-Waterman score: 1834; 64.1% identity (83.0% similar) in 459 aa overlap (1-450:1-437)
10 20 30 40 50 60
pF1KB7 MLWKITDNVKYEEDCEDRHDGSSNGNPRVPHLSSAGQHLYSPAPPLSHTGVAEYQPPPYF
::::.:::.::: ::::::::.:::. :.:.:...:: :. ::::::: :..::: ::
CCDS45 MLWKLTDNIKYE-DCEDRHDGTSNGTARLPQLGTVGQSPYTSAPPLSHTPNADFQPP-YF
10 20 30 40 50
70 80 90 100 110
pF1KB7 PPPYQQLAYSQSADPYSHLGEAYAAAINPLH-QPAPTGSQQQAWPG-RQSQEGAGLPSHH
::::: . : :: :::::... :. .:::: :: : :. .::: :::::.. : .:.
CCDS45 PPPYQPI-YPQSQDPYSHVNDPYS--LNPLHAQPQP---QHPGWPGQRQSQESGLLHTHR
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB7 GRPAGLLPH-LSGLEAGAVSARRDAYRRSDLLLPHAHALDAAGLAENLGLHDMPHQMDEV
: ::: ::::. ::: ::: . :: ::: ..::.. :..:..:: ..::
CCDS45 G-----LPHQLSGLDP-----RRD-YRRHEDLLHGPHAL-SSGLGD-LSIHSLPHAIEEV
120 130 140 150
180 190 200 210 220 230
pF1KB7 QNVDDQHLLLHDQTVIRKGPISMTKNPLN----LPCQKE-LVGAVMNPTEVFCSVPGRLS
.:.: . . :::::.:::.:..:. : .: .:. : :.:.::.:::::::::::
CCDS45 PHVEDPGINIPDQTVIKKGPVSLSKSNSNAVSAIPINKDNLFGGVVNPNEVFCSVPGRLS
160 170 180 190 200 210
240 250 260 270 280 290
pF1KB7 LLSSTSKYKVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLREKLDKIGLNLPAG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS45 LLSSTSKYKVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLREKLDKIGLNLPAG
220 230 240 250 260 270
300 310 320 330 340 350
pF1KB7 RRKAAHVTLLTSLVEGEAVHLARDFAYVCEAEFPSKPVAEYLTRPHLGGRNEMAARKNML
:::::.:::::::::::::::::::.::::.:::.: :::.:.: : . ::...:::::
CCDS45 RRKAANVTLLTSLVEGEAVHLARDFGYVCETEFPAKAVAEFLNRQH-SDPNEQVTRKNML
280 290 300 310 320 330
360 370 380 390 400 410
pF1KB7 LAAQQLCKEFTELLSQDRTPHGTSRLAPVLETNIQNCLSHFSLITHGFGSQAICAAVSAL
::..:.:::::.::.:::.: :.:: :.:: .::.::.::.::.::::: :.::::.::
CCDS45 LATKQICKEFTDLLAQDRSPLGNSRPNPILEPGIQSCLTHFNLISHGFGSPAVCAAVTAL
340 350 360 370 380 390
420 430 440 450
pF1KB7 QNYIKEALIVIDKSYMNPGDQSPADSN-KTLEKMEKHRK
:::. ::: ..:: :.. . .: .:.: :. .: :::::
CCDS45 QNYLTEALKAMDKMYLSNNPNSHTDNNAKSSDKEEKHRK
400 410 420 430
>>CCDS393.2 TFAP2E gene_id:339488|Hs108|chr1 (442 aa)
initn: 1238 init1: 714 opt: 1367 Z-score: 1052.0 bits: 203.8 E(32554): 2.8e-52
Smith-Waterman score: 1367; 54.6% identity (72.8% similar) in 452 aa overlap (17-450:10-442)
10 20 30 40 50
pF1KB7 MLWKITDNVKYEEDCEDRHDG--SSNGNPRVPHLSSAGQHLYSPAPPLSHT----GVAEY
.: :: .. :. : ::: : :.::::: :: ..::.
CCDS39 MLVHTYSAMERPDGLGAAAGGAR---LSSLPQAAYGPAPPLCHTPAATAAAEF
10 20 30 40 50
60 70 80 90 100
pF1KB7 QPPPYFPPPYQQ--LAYSQSADP---YSHL-GEAYAAAINPLHQPAPTGSQQQAWPGRQS
::: :::::: : : :.:. : . :: :. :.. . :: :: : : :: . ..
CCDS39 QPP-YFPPPYPQPPLPYGQAPDAAAAFPHLAGDPYGG-LAPLAQPQPP---QAAWAAPRA
60 70 80 90 100
110 120 130 140 150 160
pF1KB7 QEGAGLPSHHGRPAGLL-PHLSGLEAGAVSARRDAYRRSDLLLPHAHALDAAGLAEN-LG
: : .: ::: : .: ... ::: :: :. : : :::. ::
CCDS39 AARA-----HEEPPGLLAPPARAL---GLDPRRDYATAVPRLL-HGLADGAHGLADAPLG
110 120 130 140 150
170 180 190 200 210 220
pF1KB7 LHDMPHQ--MDEVQNVDDQHLLLHDQTVIRKGPISMTKNPLN-LPCQKE-LVGAVMNPTE
: . ....: .:. . : ::.::.: :: . :. : :. :::.. :: :
CCDS39 LPGLAAAPGLEDLQAMDEPGMSLLDQSVIKKVPIPSKASSLSALSLAKDSLVGGITNPGE
160 170 180 190 200 210
230 240 250 260 270 280
pF1KB7 VFCSVPGRLSLLSSTSKYKVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLREKL
::::::::::::::::::::::.::::::::::::::::::::::::::::::: :::.:
CCDS39 VFCSVPGRLSLLSSTSKYKVTVGEVQRRLSPPECLNASLLGGVLRRAKSKNGGRCLRERL
220 230 240 250 260 270
290 300 310 320 330 340
pF1KB7 DKIGLNLPAGRRKAAHVTLLTSLVEGEAVHLARDFAYVCEAEFPSKPVAEYLTRPHLGGR
.::::::::::::::.:::::::::::::::::::.::::.:::.: .:::: : : .
CCDS39 EKIGLNLPAGRRKAANVTLLTSLVEGEAVHLARDFGYVCETEFPAKAAAEYLCRQH-ADP
280 290 300 310 320 330
350 360 370 380 390 400
pF1KB7 NEMAARKNMLLAAQQLCKEFTELLSQDRTPHGTSRLAPVLETNIQNCLSHFSLITHGFGS
.:. .::.:::::.:.::::..:..:::.: :.:: : .:: ..:.::.::::::::::.
CCDS39 GELHSRKSMLLAAKQICKEFADLMAQDRSPLGNSRPALILEPGVQSCLTHFSLITHGFGG
340 350 360 370 380 390
410 420 430 440 450
pF1KB7 QAICAAVSALQNYIKEALIVIDKSYMNPGDQSPADSNKTLEKMEKHRK
:::::..:.:::. :.: .:: ... .. ... :. :: ::::
CCDS39 PAICAALTAFQNYLLESLKGLDKMFLSSVGSGHGET-KASEKDAKHRK
400 410 420 430 440
>>CCDS4933.1 TFAP2D gene_id:83741|Hs108|chr6 (452 aa)
initn: 1114 init1: 708 opt: 1008 Z-score: 779.5 bits: 153.5 E(32554): 4.2e-37
Smith-Waterman score: 1082; 46.9% identity (68.5% similar) in 454 aa overlap (14-447:11-432)
10 20 30 40 50
pF1KB7 MLWKITDNVKYEEDCEDRHDGSSNGN-PRVPHLSSAGQHL--YSPAPPLSHTGVAEYQPP
: : :::::.. .. : :... :: . ::... ..
CCDS49 MSTTFPGLVHDAEIRHDGSNSYRLMQLGCLESVANSTVAYSSSSPLTYSTTGTEFAS
10 20 30 40 50
60 70 80 90 100 110
pF1KB7 PYFPPPYQQLAYSQSADPYSHLGEAYAAAINPLHQPAPTGSQQQAWPGRQSQEGAGLPSH
::: .: :. : : ... .. : :: : . . ..::. :
CCDS49 PYFSTNHQ---YT----PLHH--QSFHYEFQHSH-PAVTPDAYSLNSLHHSQQYYQ-QIH
60 70 80 90 100
120 130 140 150 160
pF1KB7 HGRPAGL--LPHLSGLEAGAVSARR------DAYRRSDL-LLPHAHAL----DAAGL-AE
::.:. . : . .:... .. .: ::::: :: :. :. : : .
CCDS49 HGEPTDFINLHNARALKSSCLDEQRRELGCLDAYRRHDLSLMSHGSQYGMHPDQRLLPGP
110 120 130 140 150 160
170 180 190 200 210 220
pF1KB7 NLGLHDMPHQMDEVQ-NVDDQ-HLLLHDQT-VIRKGPISMTKNPLNLPCQKELVGAVMNP
.::: :..: .:. : :.:. : :::.: : :.::
CCDS49 SLGL--AAAGADDLQGSVEAQCGLVLNGQGGVIRRGGT----------C-------VVNP
170 180 190 200
230 240 250 260 270 280
pF1KB7 TEVFCSVPGRLSLLSSTSKYKVTVAEVQRRLSPPECLNASLLGGVLRRAKSKNGGRSLRE
:..::::::::::::::::::::.:::.::::::::::::::::.::::::::::: :::
CCDS49 TDLFCSVPGRLSLLSSTSKYKVTIAEVKRRLSPPECLNASLLGGILRRAKSKNGGRCLRE
210 220 230 240 250 260
290 300 310 320 330 340
pF1KB7 KLDKIGLNLPAGRRKAAHVTLLTSLVEGEAVHLARDFAYVCEAEFPSKPVAEYLTRPHLG
:::..::::::::::::.::::::::::::.::::::.:.::.:::.: :.:.:.: :.
CCDS49 KLDRLGLNLPAGRRKAANVTLLTSLVEGEALHLARDFGYTCETEFPAKAVGEHLARQHME
270 280 290 300 310 320
350 360 370 380 390 400
pF1KB7 GRNEMAARKNMLLAAQQLCKEFTELLSQDRTPHGTSRLAPVLETNIQNCLSHFSLITHGF
..:..:::.:.::..:.:::: .::::::.: :.:: .:.:. .:: :.:::::::::
CCDS49 -QKEQTARKKMILATKQICKEFQDLLSQDRSPLGSSRPTPILDLDIQRHLTHFSLITHGF
330 340 350 360 370 380
410 420 430 440 450
pF1KB7 GSQAICAAVSALQNYIKEALIVIDKSYMNPGDQSPADSNKTLEKMEKHRK
:. :::::.:..:. ..: : ..: . . . . :::.. . ::
CCDS49 GTPAICAALSTFQTVLSEMLNYLEK-HTTHKNGGAADSGQGHANSEKAPLRKTSEAAVKE
390 400 410 420 430 440
CCDS49 GKTEKTD
450
450 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Thu Nov 3 15:15:15 2016 done: Thu Nov 3 15:15:15 2016
Total Scan time: 3.540 Total Display time: 0.060
Function used was FASTA [36.3.4 Apr, 2011]