FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB5994, 609 aa
1>>>pF1KB5994 609 - 609 aa - 609 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.5991+/-0.000952; mu= 18.0120+/- 0.057
mean_var=70.0500+/-13.769, 0's: 0 Z-trim(104.3): 29 B-trim: 0 in 0/51
Lambda= 0.153239
statistics sampled from 7839 (7854) to 7839 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.588), E-opt: 0.2 (0.241), width: 16
Scan time: 2.740
The best scores are: opt bits E(32554)
CCDS3555.1 ALB gene_id:213|Hs108|chr4 ( 609) 4118 919.9 0
CCDS3556.1 AFP gene_id:174|Hs108|chr4 ( 609) 1727 391.3 2e-108
CCDS3557.1 AFM gene_id:173|Hs108|chr4 ( 599) 1452 330.5 3.9e-90
CCDS3550.1 GC gene_id:2638|Hs108|chr4 ( 474) 593 140.5 4.7e-33
CCDS56332.1 GC gene_id:2638|Hs108|chr4 ( 493) 593 140.5 4.9e-33
>>CCDS3555.1 ALB gene_id:213|Hs108|chr4 (609 aa)
initn: 4118 init1: 4118 opt: 4118 Z-score: 4916.9 bits: 919.9 E(32554): 0
Smith-Waterman score: 4118; 100.0% identity (100.0% similar) in 609 aa overlap (1-609:1-609)
10 20 30 40 50 60
pF1KB5 MKWVTFISLLFLFSSAYSRGVFRRDAHKSEVAHRFKDLGEENFKALVLIAFAQYLQQCPF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 MKWVTFISLLFLFSSAYSRGVFRRDAHKSEVAHRFKDLGEENFKALVLIAFAQYLQQCPF
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB5 EDHVKLVNEVTEFAKTCVADESAENCDKSLHTLFGDKLCTVATLRETYGEMADCCAKQEP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 EDHVKLVNEVTEFAKTCVADESAENCDKSLHTLFGDKLCTVATLRETYGEMADCCAKQEP
70 80 90 100 110 120
130 140 150 160 170 180
pF1KB5 ERNECFLQHKDDNPNLPRLVRPEVDVMCTAFHDNEETFLKKYLYEIARRHPYFYAPELLF
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 ERNECFLQHKDDNPNLPRLVRPEVDVMCTAFHDNEETFLKKYLYEIARRHPYFYAPELLF
130 140 150 160 170 180
190 200 210 220 230 240
pF1KB5 FAKRYKAAFTECCQAADKAACLLPKLDELRDEGKASSAKQRLKCASLQKFGERAFKAWAV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 FAKRYKAAFTECCQAADKAACLLPKLDELRDEGKASSAKQRLKCASLQKFGERAFKAWAV
190 200 210 220 230 240
250 260 270 280 290 300
pF1KB5 ARLSQRFPKAEFAEVSKLVTDLTKVHTECCHGDLLECADDRADLAKYICENQDSISSKLK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 ARLSQRFPKAEFAEVSKLVTDLTKVHTECCHGDLLECADDRADLAKYICENQDSISSKLK
250 260 270 280 290 300
310 320 330 340 350 360
pF1KB5 ECCEKPLLEKSHCIAEVENDEMPADLPSLAADFVESKDVCKNYAEAKDVFLGMFLYEYAR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 ECCEKPLLEKSHCIAEVENDEMPADLPSLAADFVESKDVCKNYAEAKDVFLGMFLYEYAR
310 320 330 340 350 360
370 380 390 400 410 420
pF1KB5 RHPDYSVVLLLRLAKTYETTLEKCCAAADPHECYAKVFDEFKPLVEEPQNLIKQNCELFE
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 RHPDYSVVLLLRLAKTYETTLEKCCAAADPHECYAKVFDEFKPLVEEPQNLIKQNCELFE
370 380 390 400 410 420
430 440 450 460 470 480
pF1KB5 QLGEYKFQNALLVRYTKKVPQVSTPTLVEVSRNLGKVGSKCCKHPEAKRMPCAEDYLSVV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 QLGEYKFQNALLVRYTKKVPQVSTPTLVEVSRNLGKVGSKCCKHPEAKRMPCAEDYLSVV
430 440 450 460 470 480
490 500 510 520 530 540
pF1KB5 LNQLCVLHEKTPVSDRVTKCCTESLVNRRPCFSALEVDETYVPKEFNAETFTFHADICTL
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 LNQLCVLHEKTPVSDRVTKCCTESLVNRRPCFSALEVDETYVPKEFNAETFTFHADICTL
490 500 510 520 530 540
550 560 570 580 590 600
pF1KB5 SEKERQIKKQTALVELVKHKPKATKEQLKAVMDDFAAFVEKCCKADDKETCFAEEGKKLV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS35 SEKERQIKKQTALVELVKHKPKATKEQLKAVMDDFAAFVEKCCKADDKETCFAEEGKKLV
550 560 570 580 590 600
pF1KB5 AASQAALGL
:::::::::
CCDS35 AASQAALGL
>>CCDS3556.1 AFP gene_id:174|Hs108|chr4 (609 aa)
initn: 2021 init1: 1666 opt: 1727 Z-score: 2060.1 bits: 391.3 E(32554): 2e-108
Smith-Waterman score: 1727; 40.0% identity (71.0% similar) in 610 aa overlap (1-609:1-609)
10 20 30 40 50 60
pF1KB5 MKWVTFISLLFLFSSAYSRGVFRRDAHKSEVAHRFKDLGEENFKALVLIAFAQYLQQCPF
:::: : :.::.. . :: . : . . . .. .: .. :. : :::..:. .
CCDS35 MKWVESIFLIFLLNFTESRTLHRNEYGIASILDSYQCTAEISLADLATIFFAQFVQEATY
10 20 30 40 50 60
70 80 90 100 110 120
pF1KB5 EDHVKLVNEVTEFAKTCVADESAENCDKSLHTLFGDKLCTVATLRETYGEMADCCAKQEP
.. :.:... . ..::.. .: .. : ..:: . : ::. .:::...:
CCDS35 KEVSKMVKDALTAIEKPTGDEQSSGCLENQLPAFLEELCHEKEILEKYGH-SDCCSQSEE
70 80 90 100 110
130 140 150 160 170
pF1KB5 ERNECFLQHKDDNP-NLPRLVRPEVDVMCTAFHDNEETFLKKYLYEIARRHPYFYAPELL
:..::: :: .: ..: . :: . : :.....:::..:..::::::::..::: .:
CCDS35 GRHNCFLAHKKPTPASIPLFQVPEPVTSCEAYEEDRETFMNKFIYEIARRHPFLYAPTIL
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB5 FFAKRYKAAFTECCQAADKAACLLPKLDELRDEGKASSAKQRLKCASLQKFGERAFKAWA
..: :: . ::.: . . :. : . : . :: .. :: ...:: :.:.: .
CCDS35 LWAARYDKIIPSCCKAENAVECFQTKAATVTKELRESSLLNQHACAVMKNFGTRTFQAIT
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB5 VARLSQRFPKAEFAEVSKLVTDLTKVHTECCHGDLLECADDRADLAKYICENQDSISSKL
:..:::.: :..:.:..::: :...:: .::.::.:.: .: . .::: .::..:.:.
CCDS35 VTKLSQKFTKVNFTEIQKLVLDVAHVHEHCCRGDVLDCLQDGEKIMSYICSQQDTLSNKI
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB5 KECCEKPLLEKSHCIAEVENDEMPADLPSLAADFVESKDVCKNYAEAKDVFLGMFLYEYA
:::. ::...:: ..:::: : : :. ..: . . :..::. :..::.
CCDS35 TECCKLTTLERGQCIIHAENDEKPEGLSPNLNRFLGDRDFNQFSSGEKNIFLASFVHEYS
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB5 RRHPDYSVVLLLRLAKTYETTLEKCCAAADPHECYAKVFDEFKPLVEEPQNLIKQNCELF
::::. .: ..::.:: :. :::: . .: :: : .:.. ..: : : :..: ::
CCDS35 RRHPQLAVSVILRVAKGYQELLEKCFQTENPLECQDKGEEELQKYIQESQALAKRSCGLF
360 370 380 390 400 410
420 430 440 450 460 470
pF1KB5 EQLGEYKFQNALLVRYTKKVPQVSTPTLVEVSRNLGKVGSKCCKHPEAKRMPCAEDYLSV
..:::: .:::.:: ::::.::... :. ..:... ... ::. : : . :.: ..
CCDS35 QKLGEYYLQNAFLVAYTKKAPQLTSSELMAITRKMAATAATCCQLSEDKLLACGEGAADI
420 430 440 450 460 470
480 490 500 510 520 530
pF1KB5 VLNQLCVLHEKTPVSDRVTKCCTESLVNRRPCFSALEVDETYVPKEFNAETFTFHADICT
....::. :: :::. : .::: : .:::::::.: ::::::: :. . : :: :.:
CCDS35 IIGHLCIRHEMTPVNPGVGQCCTSSYANRRPCFSSLVVDETYVPPAFSDDKFIFHKDLCQ
480 490 500 510 520 530
540 550 560 570 580 590
pF1KB5 LSEKERQIKKQTALVELVKHKPKATKEQLKAVMDDFAAFVEKCCKADDKETCFAEEGKKL
. : :: :..:::.::. :.:::.::. ::....::::.....:.::::::.::
CCDS35 AQGVALQTMKQEFLINLVKQKPQITEEQLEAVIADFSGLLEKCCQGQEQEVCFAEEGQKL
540 550 560 570 580 590
600
pF1KB5 VAASQAALGL
.. ..::::.
CCDS35 ISKTRAALGV
600
>>CCDS3557.1 AFM gene_id:173|Hs108|chr4 (599 aa)
initn: 1413 init1: 1023 opt: 1452 Z-score: 1731.6 bits: 330.5 E(32554): 3.9e-90
Smith-Waterman score: 1452; 35.5% identity (69.0% similar) in 603 aa overlap (1-599:4-597)
10 20 30 40 50
pF1KB5 MKWVTFISLLFLFSSAYSRGVFRRDAHKSEVAHRFKDLGEENFKALVLIAFAQYLQQ
.: . :: .::... . . . :: .. . ...: :.:.. ...::::::.:.
CCDS35 MKLLKLTGFIFFLFFLTESLTLPTQPRDIENFNSTQKFI---EDNIEYITIIAFAQYVQE
10 20 30 40 50
60 70 80 90 100 110
pF1KB5 CPFEDHVKLVNEVTEFAKTCVADESAENCDKSLHTLFGDKLCTVATLRETYGEMADCCAK
::. :::....:. :.::.. .:.: .... .:.:.. : . .. .. ::.:
CCDS35 ATFEEMEKLVKDMVEYKDRCMADKTLPECSKLPNNVLQEKICAMEGLPQKHN-FSHCCSK
60 70 80 90 100 110
120 130 140 150 160 170
pF1KB5 QEPERNECFLQHKDDN----PNLPRLVRPEVDVMCTAFHDNEETFLKKYLYEIARRHPYF
. .: ::. .: .. : .: : :: : :...:.:..:...:::.:::.:.
CCDS35 VDAQRRLCFFYNKKSDVGFLPPFPTL-DPEEK--CQAYESNRESLLNHFLYEVARRNPFV
120 130 140 150 160 170
180 190 200 210 220 230
pF1KB5 YAPELLFFAKRYKAAFTECCQAADKAACLLPKLDELRDEGKASSAKQRLKCASLQKFGER
.:: :: : ... . ::. .:. :: . . . :: :. :. :..: ::: .
CCDS35 FAPTLLTVAVHFEEVAKSCCEEQNKVNCLQTRAIPVTQYLKAFSSYQKHVCGALLKFGTK
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB5 AFKAWAVARLSQRFPKAEFAEVSKLVTDLTKVHTECCHGDLLECADDRADLAKYICENQD
. . .: :::.::: :: :. .:: :... . ::.::...: : . . ..:: .::
CCDS35 VVHFIYIAILSQKFPKIEFKELISLVEDVSSNYDGCCEGDVVQCIRDTSKVMNHICSKQD
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB5 SISSKLKECCEKPLLEKSHCIAEVENDEMPADLPSLAADFVESKDVCKNYAEAKDVFLGM
:::::.:::::: . :...:: . ..:. : :: . :..:..::.. :.:..
CCDS35 SISSKIKECCEKKIPERGQCIINSNKDDRPKDLSLREGKFTDSENVCQERDADPDTFFAK
300 310 320 330 340 350
360 370 380 390 400 410
pF1KB5 FLYEYARRHPDYSVVLLLRLAKTYETTLEKCCAAADPHECYAKVFDEFKPLVEEPQNLIK
: .::.::::: :. :::... :. :..:: . .: :: . :.:. .:. ....
CCDS35 FTFEYSRRHPDLSIPELLRIVQIYKDLLRNCCNTENPPGCYRYAEDKFNETTEKSLKMVQ
360 370 380 390 400 410
420 430 440 450 460 470
pF1KB5 QNCELFEQLGEYKFQNALLVRYTKKVPQVSTPTLVEVSRNLGKVGSKCCKHPEAKRMPCA
:.:. :..::. .. :.: :: .::.:: :: ..... . . :: : .. :.
CCDS35 QECKHFQNLGKDGLKYHYLIRLTKIAPQLSTEELVSLGEKMVTAFTTCCTLSE--EFACV
420 430 440 450 460 470
480 490 500 510 520 530
pF1KB5 EDYLSVVLNQLCVLHEKTPVSDRVTKCCTESLVNRRPCFSALEVDETYVPKEFNAETFTF
.. ..:...:: ..:. .. : .:: ... ::::: .:..:.:::: :. . :::
CCDS35 DNLADLVFGELCGVNENRTINPAVDHCCKTNFAFRRPCFESLKADKTYVPPPFSQDLFTF
480 490 500 510 520 530
540 550 560 570 580 590
pF1KB5 HADICTLSEKERQIKKQTALVELVKHKPKATKEQLKAVMDDFAAFVEKCCKADDKETCFA
:::.: ...: : : . ::.::: : . : :.:.... .:: :.:::::.. :.::
CCDS35 HADMCQSQNEELQRKTDRFLVNLVKLKHELTDEELQSLFTNFANVVDKCCKAESPEVCFN
540 550 560 570 580 590
600
pF1KB5 EEGKKLVAASQAALGL
::. :.
CCDS35 EESPKIGN
>>CCDS3550.1 GC gene_id:2638|Hs108|chr4 (474 aa)
initn: 424 init1: 302 opt: 593 Z-score: 706.9 bits: 140.5 E(32554): 4.7e-33
Smith-Waterman score: 596; 25.4% identity (58.3% similar) in 472 aa overlap (1-462:1-453)
10 20 30 40 50 60
pF1KB5 MKWVTFISLLFLFSSAYSRGVFRRDAHKSEVAHRFKDLGEENFKALVLIAFAQYLQQCPF
:: : . : :. : :: :: .:..: ..:. ::.:.: .: :. ... . . :
CCDS35 MKRVLVLLLAVAFGHALERG---RDYEKNKVCKEFSHLGKEDFTSLSLVLYSRKFPSGTF
10 20 30 40 50
70 80 90 100 110 120
pF1KB5 EDHVKLVNEVTEFAKTCVADESAENCDKSLHTLFGDKLCTVATLRETYGEMADCCAKQEP
:. .::.::. ....: :. . .: . . .. : : . .. :.::.:.
CCDS35 EQVSQLVKEVVSLTEACCAEGADPDCYDTRTSALSAKSCESNSPFPVHPGTAECCTKEGL
60 70 80 90 100 110
130 140 150 160 170 180
pF1KB5 ERNECFLQHKDDNPNLPRLVRPEVDVMCTAFHDNEETFLKKYLYEIARRHPYFYAPELLF
::. :. : . ..: :.: : .: ::. . . . .....: . : :: :.
CCDS35 ERKLCMAALKHQPQEFPTYVEPTNDEICEAFRKDPKEYANQFMWEYSTN--YGQAPLSLL
120 130 140 150 160 170
190 200 210 220 230
pF1KB5 --FAKRYKAAFTECCQAADKAACLLPKLDELRDEGKASSAKQRLKCASLQKFGERAFKAW
..: : . :: .:. ..:.: . .:. . .. ..:. :.. .::. .
CCDS35 VSYTKSYLSMVGSCCTSASPTVCFLKERLQLKHLSLLTTLSNRV-CSQYAAYGEKKSRLS
180 190 200 210 220 230
240 250 260 270 280 290
pF1KB5 AVARLSQRFPKAEFAEVSKLVTDLTKVHTECCHGDLLEC-ADDRADLAKYICENQDSISS
. .:.:. : :.. .: :. :.:.. ..::.. .: : . . . .:.: .. .:
CCDS35 NLIKLAQKVPTADLEDVLPLAEDITNILSKCCESASEDCMAKELPEHTVKLCDNLSTKNS
240 250 260 270 280 290
300 310 320 330 340 350
pF1KB5 KLKECC-EKPLLEKSHCIAEVENDEMPADLPSLAADFVESKDVCKNYAEAKDVFLGMFLY
:...:: :: .. : . ..: .::.. .. .:::: . ...: . . .
CCDS35 KFEDCCQEKTAMDVFVCTYFMPAAQLP-ELPDV--ELPTNKDVC-DPGNTK--VMDKYTF
300 310 320 330 340
360 370 380 390 400 410
pF1KB5 EYARR-H-PDYSVVLLLRLAKTYETTLEKCCAAADPHECYAKVFDEFKPLVE-EPQNLIK
: .:: : :. :.: .. . .: .:: . : : :. ::.. : ...:
CCDS35 ELSRRTHLPE---VFLSKVLEPTLKSLGECCDVEDSTTC----FNAKGPLLKKELSSFID
350 360 370 380 390 400
420 430 440 450 460 470
pF1KB5 QNCELFEQLGEYKF---QNALLVRYTKKVPQVSTPTLVEVSRNLGKVGSKCCKHPEAKRM
.. :: . .: : .. : : :.:... :... . . .:.::
CCDS35 KGQELCADYSENTFTEYKKKLAERLKAKLPDATPTELAKLVNKHSDFASNCCSINSPPLY
410 420 430 440 450 460
480 490 500 510 520 530
pF1KB5 PCAEDYLSVVLNQLCVLHEKTPVSDRVTKCCTESLVNRRPCFSALEVDETYVPKEFNAET
CCDS35 CDSEIDAELKNIL
470
>>CCDS56332.1 GC gene_id:2638|Hs108|chr4 (493 aa)
initn: 424 init1: 302 opt: 593 Z-score: 706.6 bits: 140.5 E(32554): 4.9e-33
Smith-Waterman score: 596; 25.4% identity (58.3% similar) in 472 aa overlap (1-462:20-472)
10 20 30 40
pF1KB5 MKWVTFISLLFLFSSAYSRGVFRRDAHKSEVAHRFKDLGEE
:: : . : :. : :: :: .:..: ..:. ::.:
CCDS56 MLWSWSEERGGAARLSGRKMKRVLVLLLAVAFGHALERG---RDYEKNKVCKEFSHLGKE
10 20 30 40 50
50 60 70 80 90 100
pF1KB5 NFKALVLIAFAQYLQQCPFEDHVKLVNEVTEFAKTCVADESAENCDKSLHTLFGDKLCTV
.: .: :. ... . . ::. .::.::. ....: :. . .: . . .. : :
CCDS56 DFTSLSLVLYSRKFPSGTFEQVSQLVKEVVSLTEACCAEGADPDCYDTRTSALSAKSCES
60 70 80 90 100 110
110 120 130 140 150 160
pF1KB5 ATLRETYGEMADCCAKQEPERNECFLQHKDDNPNLPRLVRPEVDVMCTAFHDNEETFLKK
. .. :.::.:. ::. :. : . ..: :.: : .: ::. . . . ..
CCDS56 NSPFPVHPGTAECCTKEGLERKLCMAALKHQPQEFPTYVEPTNDEICEAFRKDPKEYANQ
120 130 140 150 160 170
170 180 190 200 210
pF1KB5 YLYEIARRHPYFYAPELLF--FAKRYKAAFTECCQAADKAACLLPKLDELRDEGKASSAK
...: . : :: :. ..: : . :: .:. ..:.: . .:. . .. .
CCDS56 FMWEYSTN--YGQAPLSLLVSYTKSYLSMVGSCCTSASPTVCFLKERLQLKHLSLLTTLS
180 190 200 210 220 230
220 230 240 250 260 270
pF1KB5 QRLKCASLQKFGERAFKAWAVARLSQRFPKAEFAEVSKLVTDLTKVHTECCHGDLLEC-A
.:. :.. .::. . . .:.:. : :.. .: :. :.:.. ..::.. .: :
CCDS56 NRV-CSQYAAYGEKKSRLSNLIKLAQKVPTADLEDVLPLAEDITNILSKCCESASEDCMA
240 250 260 270 280 290
280 290 300 310 320 330
pF1KB5 DDRADLAKYICENQDSISSKLKECC-EKPLLEKSHCIAEVENDEMPADLPSLAADFVESK
. . . .:.: .. .::...:: :: .. : . ..: .::.. .. .:
CCDS56 KELPEHTVKLCDNLSTKNSKFEDCCQEKTAMDVFVCTYFMPAAQLP-ELPDV--ELPTNK
300 310 320 330 340 350
340 350 360 370 380 390
pF1KB5 DVCKNYAEAKDVFLGMFLYEYARR-H-PDYSVVLLLRLAKTYETTLEKCCAAADPHECYA
::: . ...: . . .: .:: : :. :.: .. . .: .:: . : :
CCDS56 DVC-DPGNTK--VMDKYTFELSRRTHLPE---VFLSKVLEPTLKSLGECCDVEDSTTC--
360 370 380 390 400
400 410 420 430 440 450
pF1KB5 KVFDEFKPLVE-EPQNLIKQNCELFEQLGEYKF---QNALLVRYTKKVPQVSTPTLVEVS
:. ::.. : ...: .. :: . .: : .. : : :.:... :...
CCDS56 --FNAKGPLLKKELSSFIDKGQELCADYSENTFTEYKKKLAERLKAKLPDATPTELAKLV
410 420 430 440 450 460
460 470 480 490 500 510
pF1KB5 RNLGKVGSKCCKHPEAKRMPCAEDYLSVVLNQLCVLHEKTPVSDRVTKCCTESLVNRRPC
. . .:.::
CCDS56 NKHSDFASNCCSINSPPLYCDSEIDAELKNIL
470 480 490
609 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Mon Nov 7 19:33:02 2016 done: Mon Nov 7 19:33:03 2016
Total Scan time: 2.740 Total Display time: 0.030
Function used was FASTA [36.3.4 Apr, 2011]